Testi in giapponese e cinese nei risultati di ricerca Google? Aiuto!
- Seo
- 21 giugno 2022
Indice dei contenuti
Recentemente ho avuto un problema con il sito di un cliente. I risultati di ricerca Google contenevano caratteri in giapponese o cinese. Era evidente che il sito era stato Hackerato. Facendo una ricerca nel database non risultavano i testi. Dunque Google da dove prendeva questi testi? Perchè non c’era traccia delle tringhe cinesi nel DB o nelle cartelle sul server? La risposta è molto semplice tutti i dati dei testi erano criptati dentro file posizionati nelle directory del server. Il sito era stato Hackerato.
Come potevano apparire nelle ricerche i caratteri Cinesi senza essere nel DB?
Qui sotto vedete un’immagine di un file con un codice incomprensibile e lunghissimo. Ho trovato diversi file nella root con codice criptato come questo e avendo esperienza dei nomi dei file di Joomla o Wordpress mi sono balzati subito all’occhio. Così ho potuto fare una ricerca all’interno dei file della stringa “base64_decode” e trovare tutti i file che ne facevano un uso malevolo (facile vedere il blocco di testo criptato subito dopo).
Per criptare il testo viene usato un base64 usato anche normalmente dai CMS. In questo caso il sito attaccato è un CMS Joomla ma la maggior parte dei siti afflitti da questo problema sono su Wordpress.
Come ripulire le directory dai file coinvolti?
Come accennato sopra, per risolvere il problema dei caratteri giapponesi e cinesi nella ricerca Google la prima cosa è stata individuare i file che avevano la stringa base64_decode e un malloppo di testo criptato, verificare che non fossero file originali ed eliminarli. Successivamente o scoperto che in ogni folder ( e sono tante…centinaia) era stato creato un file htaccess con delle istruzioni. In Joomla e Wordpress c’è di norma un solo file htaccess e si trova nella root. Grazie ad una funzione di ricerca avanzata di Filezilla ho potuto cercare tutti i file htacces con una precisa dimensione ed eliminarli in blocco…erano centinaia.
Infine ho cercato dentro cartelle sensibili come administrator e includes se erano stati creati altri file strani. Intanto procedevo con dei backup incrementali per tenere la situazione sotto controllo.
Una volta fatto questo si è però reso necessario andare a “dire” a Google che ora il sito andava re-indicizzato con i testi corretti. Ho quindi richiesto la scansione delle pagine e in breve facendo le ricerche le stringhe non c’erano più. Infine ho cambiato le password di accesso al backoffice, Ftp e Mysql. A questo punto al primo passaggio dello spider non c’erano più i caratteri cinesi e giapponesi nei risultati di ricerca.