[resolu] Plomber le référencement d'un concurrent, hin hin

WRInaute impliqué
Bonsoir à tous,

Voilà, je poste à moitié bourré, les yeux cernés, les cheveux défaits et le coeur gros : je me suis tiré une balle dans le pied en croyant viser la tête de robots spammeurs, résultat je n'apparais même plus sur mon ndd alors que mon site sortait en première page voire dans le trio de tête pour 80% des requêtes liées à sa thématique.

Laissez-moi vous conter comment j'ai merdé, ce n'est pas triste, et c'est surtout, à mon avis, une basse manoeuvre pour plomber mon référencement (c'est mon côté parano) :wink:

Tout commence il y a deux semaines avec un mail de mon hébergeur m'avertissant qu'une de mes règles de réécriture boucle et bouffe 100% de CPU, mettant en péril les ressources mutualisées.

Je z'yeute mes logs, et patatras, je tombe sur une grosse série d'url qui me semblent être des injections, ou du moins des tentatives, puisqu'elles ressemblent à des trucs du style :

Code:
http://www.monsite.com/rep1/****://www.fous-la-dans-l-oreille-du-panda/il-aime-ca/viewtopic.php?...

En effet, jamais utilisé l'ombre d'une telle url, d'ailleurs les codes réponse dans les logs sont pour la plupart en 404, et je ne soupçonnais aucunement la présence réelle d'un tel blasphème sur les pages de mon ainé, et Xenu Link Sleuth non plus d'ailleurs.

Donc, constat vite fait, diagnostic franc battant, je repère les ip qui provoquent ces soucis (toujours les même) et je les blackliste en bonne et due forme via un htaccess.

Aujourd'hui vers 15h, je constate que je ne ressors plus nulle part sur mes requêtes phares, même pas sur mon NDD. Grosse panique, vérifications intenses et tout et tout ...

Je vérifie mes logs : plus aucune trace des url douteuses.

Je me rends dans les gwt, poussièreux il est vrai, et là ... consternation, enfer et damnation, my god is one bitch : je vois 680 url introuvables -> les fameuses url en question!!!

En fait je blacklistais depuis des jours googlebot, slurp, baidu et sans doute l'un ou l'autre bot de moindre envergure 8O

Je sais, chuis un boulet.

En attendant, j'ai vérifié tout mon site pour essayer de trouver les fameux liens, même à partir des referers renseignés dans les gwt : rien !

De deux choses l'une : soit ils ont réellement disparu parce qu'"on" les a enlevés, soit ils sont invisibles pour les visiteurs "normaux" et seuls les bots les voient et les suivent. En tous cas plus rien aujourd'hui à ce niveau, mais je suis plombé de chez plombé.

Ce qui me dégoûte encore plus, c'est que je ne comprends pas d'où ça vient, et que je ne trouve aucun script malicieux nulle part. Je suis assis entre deux chaises, parce que si ça réapparaît et que je ne trouve rien, c'est mon hébergeur qui va de nouveau me relancer voire foutre mon site en 403 comme il l'a déjà fait.

Vous avez déjà connu la blague ou une variante locale ?

Vous avez des solutions ? Si oui je suis preneur :wink:

Pensez-vous que la sanction va durer ?

Merci d'avance

Supercureuil
 
WRInaute impliqué
Salut Carole,

Ce sont les fameuses url qui font boucler le rewriting, et que j'ai beau chercher, je ne vois pas du tout d'où elles viennent.

Tu vas me dire, "ben y'a qu'a trouver de nouvelles règles". Ok, m'aidera pour mon problème de boucle (j'y travaille d'ailleurs, et ce n'est pas évident), mais ça ne changera rien à mon déclassement.

Tu penses que ça peut durer longtemps un tel filtre ?
 
WRInaute passionné
aucune idée :(

- es-tu sûr que ce déclassement est dû à ce problème?
- as-tu vérifié les referers via analytics, ainsi que les backlinks chez Yahoo, ce qui peut être long?
- les IP que tu as blacklistées étaient donc les IP des robots? tu les avais blacklistées pour tout le site donc, ou seulement pour les url en question?
- cette histoire d'oreille de panda, c'est un exemple, ou c'est vraiment ces URLs que demandaient les moteurs?
- thématique du site stp
 
WRInaute impliqué
- es-tu sûr que ce déclassement est dû à ce problème?
Quasiment certain, je ne travaille plus au référencement de ce site depuis quelques mois, les liens se font naturellement. Si c'était un simple déclassement j'attendrais, mais là je ne ressors même plus sur mon nom de domaine qui n'existe nulle part ailleurs.

- as-tu vérifié les referers via analytics, ainsi que les backlinks chez Yahoo, ce qui peut être long?
Pour les backlincks oui et rien de neuf. Pour les referers, pas via analytics mais ça ne donne rien. Par contre dans les gwt on m'annonce clairement qu'il y a un problème avec ces url fantômes.

- les IP que tu as blacklistées étaient donc les IP des robots? tu les avais blacklistées pour tout le site donc, ou seulement pour les url en question?
Ben au début pour quelques url, puis voyant que ça le faisait un peu partout, j'ai blacklisté pour tout le site :oops:

- cette histoire d'oreille de panda, c'est un exemple, ou c'est vraiment ces URLs que demandaient les moteurs?

C'est un exemple :mrgreen: Mais en voilà une originale :

Code:
/peche-carpe/****://forum.2gfmusic.sitesuite.ws/viewtopic.php?p=14960

- thématique du site stp
La *êche des cyprinidés (le site : -http://www.karpeace.com)

Le plus fort, c'est que la dizaine d'adresses ip qui suivaient ces liens et faisaient des requêtes sur le serveur (dixit les logs) sont toutes des ip de bots from search engine ...

Je m'en veux clairement de n'avoir pas fait preuve de plus de clairvoyance

Pour donner une idée, voilà ce que ça donne :



Jamais de referer (colonne de droite)
 
WRInaute passionné
Bonjour SuperCureuil,
tu devrais remettre ton ancien .htaccess en ligne en attendant de le retravailler.

Tu pourrais le poster pour voir, il y a certainement des membres de WRI qui pourront t'aider à trouver la faille.
 
WRInaute impliqué
Ces url pointent surement sur ton site quelque part sur une page perdue dans l'immensité du web, et que google a trouvée ...
 
WRInaute accro
Vérifie qu'il n'y a pas des scripts de hack sur ton site. Tu peux trouver cela avec les fichiers log Ftp. Tu peux aussi interdire la modifications du .htaccess par tout autres moyens que le ftp.

A plus.
 
WRInaute impliqué
Re- les wristes,

tu devrais remettre ton ancien .htaccess en ligne en attendant de le retravailler.

C'est ce que j'ai fait, mais sans les règles de redirection pour les robots ... :wink:

Tu pourrais le poster pour voir, il y a certainement des membres de WRI qui pourront t'aider à trouver la faille.

Code:
RewriteCond %{REQUEST_URI} !^.*viewtopic.*
RewriteRule ^(.*)/$  /page.php?cat_clean=$1 [L]

RewriteCond %{REQUEST_URI} !^.*viewtopic.*
RewriteRule ^(.*)/((.*)-(.*)+)\.php$  /multi-page.php?categorie=$1&url_clean=$2 [L]

Voilà ce que j'utilise pour l'instant, faute de mieux. Vu qu'on retrouve très souvent "viewtopic", ça évite déjà partiellement les boucles et mon hébergeur est presque heureux.

A noter que ces règles s'appliquent sur le sous domaine -annuaire.karpeace.com

Ces url pointent surement sur ton site quelque part sur une page perdue dans l'immensité du web, et que google a trouvée ...

Dans les GWT, il m'indique une url d'origine qui se trouve sur mon site. J'ai vérifié cette page 10 fois et je n'y trouve rien. En plus ce n'est pas une page dynamique ...

Dans les statistiques et les logs, pas de referer :twisted:

Vérifie qu'il n'y a pas des scripts de hack sur ton site. Tu peux trouver cela avec les fichiers log Ftp. Tu peux aussi interdire la modifications du .htaccess par tout autres moyens que le ftp.

Déjà fait -> rien. Mais je vais encore regarder :wink:

Quant aux .htaccess, je les ai uploadés et modifiés tous les jours depuis une semaine. S'il y avait anguille sous roche à ce niveau, je l'aurais vu. Ce n'est pas ça donc.

Je continue à chercher, notamment un script malicieux fourré qq part et je vais bien fouiller toutes mes bases de données pour voir s'il n'y a rien de ce côté.

Merci à tous pour vos apports :)
 
WRInaute impliqué
allow_url_fopen On
allow_url_include Off

Je n'ai pas accès au php.ini et je ne retrouve pas cette directive en faisant un phpinfo() Concrètement ça impliquerait quoi ?

Je viens par contre de regarder mes logs et plus aucune trace des url douteuses SAUF du spam de referer ....
 
WRInaute accro
dans ton htaccess, il faut bloquer toutes les REQUEST_URI qui contiennent http:// et surtout renvoyer un code 410

Ensuite, comment google a trouvé ces url ? par adsense tiens :wink:
 
WRInaute impliqué
Merci Leonick, je vais z'yeuter à mettre des 410 (sais même pas ce que ce code signifie).

Par adsense ? Je ne comprends pas ...

Dans mes gwt, toutes les url malicieuses ont toutes comme referer la même page. Quand je scanne cette page sous tous les angles, je ne trouve RIEN. Ces urls étaient présentes sur cette page, mais elles n'y sont plus.

Dans les outils statistiques et le fichier de logs, le referer n'est jamais renseigné.
 
WRInaute impliqué
demane de reinclusion dans google, ca marche , j'ai essayé pour un des sites qui s'est fait hacker avec ajout de 10aines de milliers de pages de c*l

va voir se que te dis ggwebmaster tools
 
WRInaute impliqué
Bonjour à tous les lecteurs assidus de ce fil de conversation, trompés que vous êtes par un titre bien racoleur digne de la plus basse presse à sensation :mrgreen:

Voilà, c'est réparé !!!!!

Je constate ce matin le retour de mes sitelinks ainsi que mes bonnes positions sur les requêtes phares que je vise !

J'ai reposté un sitemap il y a 48 h à peine, je ne sais pas s'il faut y voir un lien de cause à effet. Au moment de poster ce sitemap, j'ai
par ailleurs constaté que les url malicieuses et introuvables (600 et quelques) ne se trouvaient plus dans les GWT).

Je suis heureux.

Merci pour le soutien et les conseils, ça met toujours du baume au coeur de voir que l'on n'est pas seul dans cette jongle ;)

Change d'hébergeur, remet au propre le site, et demande a gogole une réinclusion.

J'ai bien fait d'attendre hein :wink:. Et puis, n'étant pas blacklisté je ne pouvais demander de réinclusion.

@+

Supercureuil
 
Discussions similaires
Haut