On dit qu'il vaut mieux éviter les id de sessions dans les url que l'on souhaite indexer, au risque de faire perdre la boule aux robots qui trouveraient à chaque passage sur une page des url différentes pour un même contenu.
Je me suis donc penché sur ce que faisaient 2 gros sites d'ecommerce pour lesquels je me souvenais avoir pendant la navigation des url à rallonge, alors même que je n'avais pas créé de compte : test donc sur Amazon, le tout puissant et Fnac pour dire de regarder un français...
Pour commencer, une petite commande site: dans google et je découvre ce à quoi je m'attendais : les url des fiches produits indexées sont bien propres...
Ensuite, historique/cookies bien effacés
1/ je démarre par amazon, en tapant directement l'url de leur home, www.amazon.fr
- 1er clic sur le lien vers le dvd Pirates des Caraibes mis en avant, et voilà l'url de la page sur laquelle j'arrive:
http://www.amazon.fr/gp/product/B000XCX ... d_i=405320
(je vous avais parlé de rallonges, là c'est même imbuvable!)
- Je recommence cette fois en activant l'User Agent Googlebot (https://www.webrankinfo.com/forum/t/extension-useragent-switcher-avec-firefox.33943/ )
et là j'arrive sur la même fiche mais avec une url bien allégée, celle qui est finalement indexée : http://www.amazon.fr/Pirates-Caraibes-J ... B000XCXGLK
2/ Je refais la même manip sur le site de la fnac
- avec user agentswitcher désctivé :
http://www4.fnac.com/shelf/article.aspx ... 9c3&UID=...
- avec user agent switcher réglé sur googlebot:
http://www4.fnac.com/shelf/article.aspx ... 5&PID=6484
Indéniablement, ces 2 sites réagissent différemment que je sois "googlebot" ou moi-même...
Autant avec Fnac, l'url est simplement tronquée, avec Amazon, elle est carrément réécrite, avec le titre "Pirates-Caraibes-Jusquau-bout-monde" dans l'url. (or des mots clés dans l'url c'est toujours un petit plus pour se positionner...)
Celà ne s'arrête pas là pour Amazon :
- avec user agent désactivé, je clique sur la fiche produit "ocean 13", je reviens sur la fiches pirates des caraibes et là un nouvel élément apparait "Articles que vous avez consultés récemment" : Ocean 13"
- même chemin avec user agent sur googlebot, et là pas d'historique affiché, pas de "Articles que vous avez consultés récemment"
:arrow: Au delà de réécrire les url en y ajoutant des mots clés, amazon présente aussi un contenu différent à googlebot (un contenu allégé de l'historique du surf)
:arrow: quant à fnac, le contenu des pages est identique, seule l'url est tronquée des id de sessions pour googlebot...
Je ne leur jette pas la pierre, cette façon de faire n'est pas là pour tromper le visiteur (quoique amazon réécrit ses url quand même pour les optimiser) mais est-ce à proprement parler du cloaking?
Et si non, si parmi vous il y a des pros de cette méthode, vous pouvez la faire partager?
Je me suis donc penché sur ce que faisaient 2 gros sites d'ecommerce pour lesquels je me souvenais avoir pendant la navigation des url à rallonge, alors même que je n'avais pas créé de compte : test donc sur Amazon, le tout puissant et Fnac pour dire de regarder un français...
Pour commencer, une petite commande site: dans google et je découvre ce à quoi je m'attendais : les url des fiches produits indexées sont bien propres...
Ensuite, historique/cookies bien effacés
1/ je démarre par amazon, en tapant directement l'url de leur home, www.amazon.fr
- 1er clic sur le lien vers le dvd Pirates des Caraibes mis en avant, et voilà l'url de la page sur laquelle j'arrive:
http://www.amazon.fr/gp/product/B000XCX ... d_i=405320
(je vous avais parlé de rallonges, là c'est même imbuvable!)
- Je recommence cette fois en activant l'User Agent Googlebot (https://www.webrankinfo.com/forum/t/extension-useragent-switcher-avec-firefox.33943/ )
et là j'arrive sur la même fiche mais avec une url bien allégée, celle qui est finalement indexée : http://www.amazon.fr/Pirates-Caraibes-J ... B000XCXGLK
2/ Je refais la même manip sur le site de la fnac
- avec user agentswitcher désctivé :
http://www4.fnac.com/shelf/article.aspx ... 9c3&UID=...
- avec user agent switcher réglé sur googlebot:
http://www4.fnac.com/shelf/article.aspx ... 5&PID=6484
Indéniablement, ces 2 sites réagissent différemment que je sois "googlebot" ou moi-même...
Autant avec Fnac, l'url est simplement tronquée, avec Amazon, elle est carrément réécrite, avec le titre "Pirates-Caraibes-Jusquau-bout-monde" dans l'url. (or des mots clés dans l'url c'est toujours un petit plus pour se positionner...)
Celà ne s'arrête pas là pour Amazon :
- avec user agent désactivé, je clique sur la fiche produit "ocean 13", je reviens sur la fiches pirates des caraibes et là un nouvel élément apparait "Articles que vous avez consultés récemment" : Ocean 13"
- même chemin avec user agent sur googlebot, et là pas d'historique affiché, pas de "Articles que vous avez consultés récemment"
:arrow: Au delà de réécrire les url en y ajoutant des mots clés, amazon présente aussi un contenu différent à googlebot (un contenu allégé de l'historique du surf)
:arrow: quant à fnac, le contenu des pages est identique, seule l'url est tronquée des id de sessions pour googlebot...
Je ne leur jette pas la pierre, cette façon de faire n'est pas là pour tromper le visiteur (quoique amazon réécrit ses url quand même pour les optimiser) mais est-ce à proprement parler du cloaking?
Et si non, si parmi vous il y a des pros de cette méthode, vous pouvez la faire partager?