Google suit les onclick et/ou appels AJAX ?

WRInaute discret
Salut,

Je ne sais pas trop comment Google s'est débrouillé, mais il a réussi la performance d'indexer une page qui n'est appelé qu'en AJAX.
Sur mon www, dans la colonne de droite, vous pouvez voir un bloc photo au hasard. Il est possible de demander une autre image au hasard et l'appel se fait ici en AJAX (via XAJAX pour ceux qui savent). C'est le seul endroit ou une certaine url en question est apellé et l'appel ne se fait que de manière asynchrone. L'internaute n'accède jamais directement à la dite url via son navigateur.
Et voilà que je la retrouve dans mes résultats Google.

Si quelqu'un à une explication rationelle...
 
WRInaute impliqué
Peut-être que qulqu'un ayant la barre d'outils google (ou firefox) s'est amusé à consulter cette adresse ?
 
WRInaute discret
Honnêtement, j'en doute. Rien dans ma page ne fait référence à cette page-AJAX.
Il y'a bien dans le code source une manière de la déduire, mais très franchement, sans être au courant je doute que cela soit possible.
 
WRInaute impliqué
d'un autre coté ta page wxw.starnab.cxm/xajax/callrenvoie une page html donc du coup google se pose pas la question, il voit une page en html il l'indexe. Ca aurait été du xml ou du json pas sure qu'il te l'aurait indéxé.

Maintenant qd tu développes fais tu appel à cette page pour tes tests, est ce tu as la googlebar ?
Toujours lors de tes tests si tu appelles cette url comme il y a aussi des adsenses dessus le bot adsense passe aussi.

ceci pourrait expliquer cela.

Sinon google aurait récupéré l'url dans ton javascript .... c aussi du domaine du pensable mais bon
 
WRInaute impliqué
Si vous pouviez éviter de visiter la dite page.

Ca n'a pas de pertinence d'avoir l'url de la page en fait.
Pourquoi il n'y a pas d'interdiction d'accès à cette page dans le robots.txt ?

Et accessoirement, pourquoi il y a du contenu sur cette paege ?
 
WRInaute discret
petit-ourson a dit:
Si vous pouviez éviter de visiter la dite page.

Ca n'a pas de pertinence d'avoir l'url de la page en fait.
Pourquoi il n'y a pas d'interdiction d'accès à cette page dans le robots.txt ?

Et accessoirement, pourquoi il y a du contenu sur cette paege ?

Excuse moi, mais tu prends le problème de travers. La question n'est pas de savoir ce qu'il faut faire pour que cette page ne soit pas indexée, mais de savoir comment Google l'a trouvé.
Ca ne me dérange pas qu'elle soit indexée, c'est simplement que je trouvais cela étrange et qu'il y'avait peut-être matière à déduire le comportement de Google face à l'AJAX.

Concernant le contenu sur la page, la mécanique qu'il y'a derrière cette simple URL est un peu complexe à expliquer. Dans le process normal, elle ne renvoie que du XML.
 
WRInaute discret
Je te garantis le contraire. Je développe en local sur ma machine et mes tests sont fait sur celle-ci. Pour tout te dire d'ailleurs, cette URL m'était totalement inconnue avant que je ne la retrouve dans l'index de Google. Elle correspond en fait à un module externe qui se greffe sur le CMS que j'utilise.
 
WRInaute impliqué
Bien reste 3 possibilités

-quelqu'un d'autres que nous à regarder cette page avec adsense activé :)
-quelqu'un d'autres que nous à regarder la page avec la googlebar
-GoogleBot a lu ton javascript.
 
Discussions similaires
Haut