FullFlash + Robots.txt + PHP = Cloaking ?

Nouveau WRInaute
Bonjour,

Je travaille actuellement sur un projet de site qui doit être en Full-Flash et qui utiliserait une base MySQL.
Afin d'optimiser son référencement, je pensais pouvoir utiliser la combine Robots.txt pour orienter le Googlebot vers une 2eme version du site en PHP qui reprendrait l'intrégralité du contenu proposé dans le Flash. Ce 2eme site ne serait accessible que pour le Googlebot.

On m'a dit que cette technique pourrait être apparentée à du cloaking.
Est-ce que vous confirmez ?

Merci d'avance pour votre aide.

G!
 
WRInaute occasionnel
chugulu a dit:
Bonjour,

Je travaille actuellement sur un projet de site qui doit être en Full-Flash et qui utiliserait une base MySQL.
Afin d'optimiser son référencement, je pensais pouvoir utiliser la combine Robots.txt pour orienter le Googlebot vers une 2eme version du site en PHP qui reprendrait l'intrégralité du contenu proposé dans le Flash. Ce 2eme site ne serait accessible que pour le Googlebot.

On m'a dit que cette technique pourrait être apparentée à du cloaking.
Est-ce que vous confirmez ?

Merci d'avance pour votre aide.

G!
Comment cette version ne serait-elle accessible qu'à googlebot ? Si c'est en mettant un lien un peu caché sur ta page, ce n'est pas du cloaking. Si c'est en présentant une page à gogolebot contenant ce lien, et un page ne contenant pas le lien au visiteur lambda, c'est effectivement du cloaking.

Deuxième question, une fois les pages du site en php indexées dans gogole, qu'arrive-t-il à l'internaute qui clique sur un lien vers ton site ?
est-il redirigé vers la version flash, ou voit-il la version présentée à googlebot ? réponse 1: c'est du cloaking, réponse 2, ce n'est pas du cloaking.

Il n'y a pas de combine "robots.txt".

Je ne comprends pas qu'on choississe une techno non indexable et qu'on ne l'assume pas.

Si tu veux absolument que le site soit indexé, tu fais un site indexable.

Le flash c'est bien pour tout ce qui est graphique, mais il est possible de faire des pages au contenu mixte, qui leur permettrait d'être très correctement indexées par les moteurs.

Coller du contenu de valeur dans du flash, c'est une erreur. Faire un doublon de ton site en php, c'est également une erreur. Après, je comprends qu'on doive parfois se plier aux demandes du client quand celui-ci refuse de comprendre que full flash et indexation ne vont pas de pair... dans ce cas, la moins mauvaise solution est de faire un site en flash, et un autre en php, tout en sachant que la grande majorité des visiteurs ne verront que le site en php car ils viendront des moteurs, et qu'ils seront très frustrés lors de leur deuxième visite (après avoir retenu le nom de domaine) de ne pas rertouver les pages qu'ils auront vu lors de leur première visite...

En tout état de cause, le cloaking n'est pas recommandé.
 
Nouveau WRInaute
Il n'y a pas de combine "robots.txt".

Ah bon ? Pourquoi dans ce cas ton robots.txt n'est accessible qu'au UA Googlebot ?

Edit: L'idéal est de faire une alternative à flash dans ta page html ou de faire carrement un version html du site.
 
WRInaute occasionnel
Seb42 a dit:
Il n'y a pas de combine "robots.txt".

Ah bon ? Pourquoi dans ce cas ton robots.txt n'est accessible qu'au UA Googlebot ?
super.
Quel est l'intérêt exactement de rendre son robots.txt accessible uniquement à googlebot ?

Quand je me balade sur un site, je me fous pas mal de savoir ce qu'il y a dans le robots.txt, alors si google a indexé une page dont l'url n'est "trouvable" que via le robots.txt, quand je clique sur le lien de la page de résultats google, je tombe sur le résultat, et donc sur la page en question, basta.

Le robots.txt est à l'attention des... robots, quand on veut autoriser google et pas msn par exemple.
chugulu parle de google, mais ce qu'il dit est fort probablement applicable à tous les moteurs, puisqu'il cherche clairement à ce que son site soit visible sur le net, pourquoi se limiter à google ? aucun intérêt.

D'autre part, google n'a aucun intérêt à indexer une page qui n'est accessible qu'en allant visiter le robots.txt ; je doute fort qu'on tombe une des ces pages lors d'une recherche.

Bref, il n'y a pas de combine "robots.txt", le cloaking c'est mal, et dupliquer un site flash en php est une bidouille.
 
Nouveau WRInaute
Oui mais tu dois néanmoins reconnaitre que tu cloak ton robots.txt sur l'ua et que c'est faisable ...

maintenant l'intéret n'est pas si grand dans le cas présent de faire du cloaking...

Edit: ton robots.txt n'est plus cloaker dsl j'viens de regarder
 
WRInaute occasionnel
Peux tu un peu plus préciser?
je ne comprends pas trop pourquoi tu veux lui présenter un robots.txt différent?

Tu veux cloacker msn et yahoo mais pas google, ou bien? :?
 
WRInaute occasionnel
Seb42, le robots.txt du site que j'ai en signature n'a jamais été cloaké.

Spationaute, il n'y a aucun intérêt à présenter un robots.txt différent ici.

Je suppose que l'intervenant initial ne savait pas trop de quoi il parlait, et il allait juste à la pêche...
 
WRInaute occasionnel
spationaute-troglodyte a dit:
entre faire un robots.txt avec une spécification du useragent pour chaque moteur à qui on veut faire un "chemin" différent, je prefere cloacker, c'est moins louche

http://www.exalead.fr/robots.txt ca c'est trop flag par exemple
bof.

Suffit de changer de user agent pour repérer la supercherie. En plus, qui te dit que le bot chargé de checker le robots.txt chez google s'appelle aussi googlebot ? :lol:

Après tout, ils peuvent très bien utiliser un bot qui se fasse passer pour IE, ça ne pose pas de problème tant qu'il ne fait que checker le fichier robots.txt...

Tiens, le dernier bot qui est passé sur mes page, c'est justement "Mediapartners-Google"... depuis qu'on ne sait plus trop qui fait quoi chez google, c'est peut-être lui qui est venu récupérer mon robots.txt, et si j'ai cloaké sur du "googlebot", c'est mort... :wink:
 
Nouveau WRInaute
Salut fait gaffe quand meme, google blackliste directement le domaine et les sous domaines.


Dans tous les cas il ne faut pas te fier au robots.txt pour detecter google.


Ensuite si tes pages cloakées contiennent du texte optimisé et qu'un utilisateur tape ce texte. Les textes de descriptions de google contiendront ce texte et non pas tes meta descriptions.


La regle de base étant de ne pas laisser l'utilisateur sur ta page cloakée => redirection immédiate.



Dans ton cas il y a des méthodes SIMPLES qui permettent de ne pas tomber dans la catégorie "cloaker" : il s'agit du Javascript.


Tu charges une version texte de ta page propre qui est remplacé dynamiquement par tes appli flash.

Je crois que ca s'appelle le "cifr" ou un truc comme ca et ca existe depuis très longtemps.

A chaque fois que je passe sur ce forum, je m'apercois que les utilisateurs ont bien 10 ans de retard sur le reste des webmasters.
 
Discussions similaires
Haut