GoogleBot & référencement de contenu Ajax : parades, solutions

WRInaute accro
Bonjour,

On sait depuis très peu de temps que Google peut crawler et indexer le contenu ajax.

Nous, référenceurs, allons devoir trouver des parades pour empêcher le bot d'emmagasiner n'importe quelle info.

Questions (et il serait intéressant de faire un topic constructif pour récapituler les infos) :
- Quels sont les évènements JS que GoogleBot peut déclencher ? Ceux qu'il ne peux pas déclencher ?
- Quels sont les moyens d'interdire à GoogleBot l'accès à du contenu Ajax ?
- Existe t il enfin une solution pour appliquer un équivalent de <noindex> à une partie/ un bloc de contenu dans une page ?

Je parle bien entendu de toute méthode non risquée (pas de cloacking).

Merci d'avance à tout le monde

PS : en tout cas, ça devrait permettre d'assainir les relations entre DA/intégrateurs et référenceurs.
.
.
.
.
Ou pas.
 
WRInaute accro
milkiway a dit:
- Quels sont les moyens d'interdire à GoogleBot l'accès à du contenu Ajax ?

Verify that we're allowed to crawl the resources needed to render your page. In the example above, if hot-fudge-info.html is disallowed by robots.txt, Googlebot won't fetch it. More subtly, if the JavaScript code that issues the XMLHttpRequest is located in an external .js file disallowed by robots.txt, we won't see the connection between yummy-sundae.html and hot-fudge-info.html
http://googlewebmastercentral.blogspot.com/2011/11/get-post-and-safely ... re-of.html
 
WRInaute impliqué
Mouais...
et ?

ok, on place le code dans un fichier en disallow... Mais cela n'empêche que l'évènement déclencheur et lui belle et bien dans une page allow et que le résultat sera fournit sur cette dite page...

Ou alors j'ai rien compris ce qui est possible vu mon niveau Bac-12 en Britsh... :-)
 
Olivier Duffez (admin)
Membre du personnel
C'est aussi ce que je conseille dans mon article :roll: pour la peine j'ajoute un lien dans le 1er post de ce topic ;-)
Si le fichier Javascript qui contient la fonction appelée est bloqué aux crawlers, l'événement ne se déclenchera pas quand le crawler vient.
 
WRInaute accro
WebRankInfo a dit:
C'est aussi ce que je conseille dans mon article :roll: pour la peine j'ajoute un lien dans le 1er post de ce topic ;-)
Si le fichier Javascript qui contient la fonction appelée est bloqué aux crawlers, l'événement ne se déclenchera pas quand le crawler vient.
Désolé je ne lis pas le site donc je n'avais pas vu. Mais la réponse de spout est parfaite avec un lien à la source.

En tout cas j'ai hate qu'on puisse définir des blocs non indexables au sein d'une page.
 
Discussions similaires
Haut