Pages "protégées" : donner accès à Googlebot

WRInaute passionné
Bonjour à tous,

Google indique ceci dans son aide : https://www.google.fr/support/news_pub/b ... opic=11707

En gros, ils expliquent qu'il est tout à fait possible et toléré de donner accès à Googlebot sur des pages protégées (des pages que le visiteur ne peut par exemple accéder que lorsqu'il est enregistré sur le site).

La technique est de tester la valeur du user-agent.
Si user-agent = Googlebot, on donne l'accès à la page.

Cette explication est donnée dans le cadre de Google News.

A votre avis, est-ce également autorisé au niveau indexation dans le moteur de recherche Google?
 
WRInaute passionné
Salut,

Si le simple fait d'avoir un "user-agent = Googlebot" donne accès à tes pages, je ne considère pas qu'elles sont protégées.

Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.
 
WRInaute impliqué
Il ne faut bien évidemment pas se baser QUE sur le user-agent, qui est facilement modifiable.
Il faut regarder le reverse DNS de l'IP, et l'IP du reverse DNS obtenu. Si les 2 IP correspondent et que le reverse fini par google.com, c'est bien un Bot Google.
 
WRInaute discret
dorian53 a dit:
Salut,

Si le simple fait d'avoir un "user-agent = Googlebot" donne accès à tes pages, je ne considère pas qu'elles sont protégées.

Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.

Et surtout, il te suffit alors de retourner sur la recherche et de faire "voir page en cache" :) truc et astuce pour pas mal de site... (experts-exchange? :))
 
WRInaute passionné
dorian53 a dit:
Salut,
Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.

Je me suis mal expliqué.
Il n'est pas question de tricher.

Je prends un exemple pour mieux me faire comprendre :
Prenons l'exemple d'un site d'actualité.
Je vais sur le site et je fais une recherche parmi les articles.
Je tombe sur une liste de résultats. Je décide de cliquer sur l'un de ces résultats afin de lire l'article complet et là je reçois un message / popup qui m'indique que je dois m'inscrire pour consulter cet article.

Maintenant, je souhaite que ces articles "protégés" soient tout de même indexés par Google.
Donc lorsque dans une recherche Google on tombe sur un de ces articles, on y a bien accès. Et la page présentée et identique à celle présentée au visiteur qui est inscris sur le site.
Mais on a accès qu'à cet article là, pas à tous les autres, à moins de s'inscrire sur le site.
 
WRInaute impliqué
Ben le visiteur qui vient de Google n'est pas forcément inscrit, donc il ne voit pas la page qu'il souhaitait voir mais un message l'invitant à s'inscrire....
 
WRInaute passionné
Non car la restriction d'accès n'est pas mise en place dans le code de la page article elle-même mais plutôt au niveau du lien vers l'article dans la page de résultats interne du site.
 
WRInaute impliqué
Ok donc c'est de la restriction bidon, facilement contournable...

Reste plus qu'elle soit en Javascript, et Google passe déjà dessus sans la voir :lol:
 
WRInaute passionné
Pas en javascript, et pas si bidon que cela :wink:

Pourrions nous en revenir à ma question initiale : est-ce que google tolère cette pratique uniquement pour Google Actu ou est-ce également le cas pour l'indexation dans son moteur?
 
WRInaute passionné
sdamain a dit:
dorian53 a dit:
Salut,
Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.

Je me suis mal expliqué.
Il n'est pas question de tricher.

Je prends un exemple pour mieux me faire comprendre :
Prenons l'exemple d'un site d'actualité.
Je vais sur le site et je fais une recherche parmi les articles.
Je tombe sur une liste de résultats. Je décide de cliquer sur l'un de ces résultats afin de lire l'article complet et là je reçois un message / popup qui m'indique que je dois m'inscrire pour consulter cet article.

Sisi j'avais bien compris :) et d'ailleurs...

FloBaoti a dit:
Ben le visiteur qui vient de Google n'est pas forcément inscrit, donc il ne voit pas la page qu'il souhaitait voir mais un message l'invitant à s'inscrire....

Je confirme ce point de vue qui est exactement le même que moi.
 
WRInaute accro
Bonjour Seb, ca faisait longtemps qu'on t'avait pas vu sur ce forum. :wink:

Créer un compte pour Google et pas pour les utilisateurs me semble assez risqué, simplement parceque le cache et le contenu sera différent pour le visiteur (en plus que le cache sera visible par l'utilisateur). Ca risque très vite d'attérir dans un spams report.

Dans l'article de Google, il ne parle pas exactement du User-Agent mais polutôt de l'adresse IP dans la plage 66.249.64.0 - 20 (une petit nuance). Ca me semble putôt réservé aux actualités, pas au robots d'indexation. Déjà plusieurs ne sont pas repris dans la plage d'adresse indiquée par l'article. Je pense que la plage d'adresse est spécifique pour les robots de news.

Je jouerais pas trop à celà, du moins c'est mon avis.
 
WRInaute passionné
Je viens très régulièrement mais je ne poste plus beaucoup.

Il n'y aurait pas de différence entre le cache et le contenu, car ce serait identiquement les mêmes pages avec identiquement le même contenu.
Simplement, le visiteur ne pourrait pas arriver jusqu'à l'article sans s'inscrire tandis que Google y aurait accès.

Merci pour ton opinion sur la tolérance de Google par rapport à ce sujet, enfin un membre qui répond à ma question initiale :wink:
 
Discussions similaires
Haut