comportement de google très suspect (formulaires)

  • Auteur de la discussion Auteur de la discussion fraid26
  • Date de début Date de début
WRInaute discret
Bonjour à tous.

Depuis quelques jours je constate un comportement de google très suspect sur mon site,
et j'en viens même à supposer que mon script contient une erreur (pourtant tellement simple).

Je trace donc mes visiteurs pour voir leur parcours sur le site / page d'entrée / provenance.

Le comportement du visiteur "google" semble bien celui d'un robot :
- pas de provenance enregistrée
- page d'entrée très aléatoire
- aucune relation entre deux pages crawlées successivement
- plusieurs centaines de pages visionnées chaque jour, à raison d'une toutes les quelques minutes...

jusque là tout va bien, MAIS, dans ces pages visionnées il y en a une qui contient un formulaire en $_get,
c'est un quiz sur les capitales, google remplit ce formulaire, avec effectivement des noms de capitales (je n'ai pas eu le temps de regarder si les réponses étaient justes cependant). Bon ok certes.

Et chose extrêmement bizarre :
hier un utilisateur s'inscrit sur mon site (pseudo passé en $_get pour atteindre le formulaire d'inscription),
et google a utilisé cette url (avec ce MÊME pseudo en $_get), et 1 à 2 minutes avant l'utilisateur ?!!

Le parcours de l'utilisateur semble pourtant réel : page d'entrée via une recherche sur google, parcours sur le site tout à fait probable...

Quelqu'un aurait il une explication à cela ?

Google utiliserait il des urls récupérées à l'aide de script adsence ou de la toolbar par exemple ???

Ce qui m'embêterait énormément car il pourrait crawler des pages dont je suis le seul a avoir accès (pas protégées, mais url à connaître par coeur non liée à une autre page)

Je vais peut être contacter ce membre pour savoir s'il utilise la toolbar pour voir si il y a une piste...

des idées ??

EDIT : en regardant encore de plus près les urls crawlées par google, je m'aperçoit qu'il y en a une qui est accessible qu'aux membres logués : page.php?deconnexion=oui
Soit google peut se loguer sur mon site, mais j'y crois peu, soit il crawle réellement les urls des visiteurs du site, soit mon script à un soucis (ça parait le plus probable lol) je vais mettre un petit ajout en plus sur mon script pour voir si le membre est réellement logué lorsqu'il visite la page, ainsi si google visite une url uniquement accessible aux membres logués, je pourrai savoir s'il a récupéré cette url d'un membre ou s'il s'est réellement logué... je ne sais pas si c'est clair :lol:
 
WRInaute discret
oui j'ai egalement lu ce topic avant de poster...
mais le fait qu'il ai utilise un pseudo d'un membre qui existe reelement est super curieux : il n'a aucun moyen d'avoir acces aux pseudos via le site...
 
WRInaute discret
Oui je le savais,
mais comment obtient il un pseudo d'un membre, puisque ceux ci n'apparaissent pas sur le site web ??
C'est pour ça que je me demandais s'il ne se servait pas des infos récupérées via la toolbar, ou des adsences...
après tout grace aux scripts adsence il peut récupérer une l'url (à laquelle il n'aurait pas accès normalement), et la crawler ?
 
Discussions similaires
Haut