Cloaking et contenu dupliqué

WRInaute discret
Bonjour,

si on est pénalisé pour contenu dupliqué mais que ce contenu est essentiel pour l'internaute, comment peut on le garder sans faire de cloaking ?
De plus on peut être amené à faire de l'ajax pour charger de façon asynchrone une partie du site et gagner en performance, j'imagine que c'est aussi considéré comme du cloaking ? malgré les bonnes intentions... alors comment résoudre ce soucis ?

Merci pour vos réponses
 
WRInaute accro
Bonjour

Tu peux éventuellement intégrer le contenu dupliqué dans des images de cette façon aucun DC. (J'imagine qu'il y a peut être d'autres solutions)

Mais tu parles de DC interne ou de DC externe?
Si c'est interne peut être serait-il bon de réfléchir autrement la structure du site. Ou de minimiser ce DC.
 
WRInaute accro
Tu copies donc du contenu d'autres sites?
Quel est l'intérêt pour l'utilisateur alors qu'ils peuvent trouver l'info là où le contenu a été dupliqué?

Y a t-il beaucoup de contenu dupliqué sur ton site?

ne connaissant pas le site, et juste avec le peu d'info que tu donnes, la seule chose qu'on peut te conseiller c'est vivement créer ton propre contenu. Donc de modifier intégralement le contenu dupliqué
 
WRInaute discret
Alors oui je donne pas tous les détails mais c'est fait exprès.
J'ai envie de répondre quel est l’intérêt de proposer des API pour les webmaster ? dans ce cas ou il y a forcément DC...

De plus ma deuxième question est tout aussi importante voir plus...
Comment ne pas faire de cloaking lorsqu'on charge des éléments par ajax (pour gagner en performance) ?
Par exemple dans twitter le fait que la page apparaît au fur à mesure n'est pas considéré comme du cloaking ?
Pourtant certain pourrait en abuser judicieusement...
 
WRInaute accro
Non je pense que google est capable de faire la différence entre l'utilisation d'ajax qui permet d'afficher du contenu seulement quand l'utilisateur le demande ou au scrolling de la page et le cloaking.
heureusement d'ailleurs sinon bon nombre de sites seraient dans les choux :mrgreen:

Je ne connais pas twitter (je m'en sers pas encore), mais j’imagine que ça fait la même chose que Facebook?
Ce n’est pas comparable au Cloaking. Cloaking=Affichage différent pour google et pour les utilisateurs.
mais ne maitrisant pas l'Ajax, je laisse la réponse à des spécialistes dans le domaine :wink:
 
WRInaute discret
Tu dis non mais que fait il dans ce cas.
Imaginons je fais un lien, cliquez ici pour voir l'article.
Et grâce a l'ajax , quand l'internaute clique, j'insère en plein milieu de ma page un article libre de droit (bien sur) qui est repris sur plein d'autres sites.
Je pense que 1 il y a contenu dupliqué et 2 c'est une sorte de cloaking, non ?
 
WRInaute accro
il me semble que google avait donné des consignes concernant l'utilisation de l'ajax, et qu'on en a parlé sur le forum et dans les dossiers de WRI.

Après comme indiqué je ne maitrise pas l'ajax mais tu devrais trouver suffisamment d'info sur la toile pour procéder correctement et éviter tout désagrément d'un point de vue SEO :wink:

Mais mon avis, qui vaut ce qui vaut, c'ets que tu n'as aucun soucis a te faire. Mais sans voir réellement de quoi il s'agit concrètement difficile à dire :wink:

Ton contenu est caché mais présent sur la page ou lorsque tu clique sur "cliquez ici" tu vas le chercher dans la BDD?
 
WRInaute accro
Habituellement, le cloaking c'est davantage présenter du contenu en plus au moteur de recherche, pas en moins. A mon sens, aucun souci.
 
WRInaute discret
j'ai vu une video de matt cutts de 2011 qui exliquait les raisons du cloaking qui sont tout à fait juste. C'est à dire que n'importe qui pourrai mettre n'importe quoi (comme du contenu pornographique). C'est ce qui me fait hésiter. Je souhaite être le plus juste possible vis a vis du moteur google bien sur.
D'un coté je me dis, faut pas que je me prenne une claque pour DC et de l'autre pour du cloaking...
 
WRInaute accro
A un moment, il faut aussi savoir arrêter la paranoïa. Et pour rebondir sur ce qui a été dit plus haut, il y a aussi la solution de générer ces textes en image. Ce qui peut se faire à la volée et n'est pas plus compliquée de passer par un système en ajax.
 
WRInaute discret
Merci de vos réponses, j'avoue que je vous dirais bien le fond du projet pour que vous puissiez mieux comprendre mais je ne peux pas.
Ce que dit google c'est qu'il souhaite un instantané identique de ce que vois l'internaute et le moteur. Dans ce cas je souhaite caché une partie pour être mieux référencé (soyons clair) mais c'est dans le but de ne pas faire de DC. Car si je ne le cache pas je suis quasi sur a 100% que je me prend une claque pour DC.
J'ajoute que c'est uniquement pour l'internaute et une meilleur expérience utilisateur sinon je m'en passerais.

Je donne un exemple plus simple. En cliquant sur un onglet on charge (par ajax) un fichier php qui s'affiche dans la page. Ce contenu n'est pas dans la page par défaut. On peut donc imaginez charger n'importe quoi. Pour moi c'est limite au niveau du moteur non ?
 
WRInaute accro
BoboAsh a dit:
J'ai envie de répondre quel est l’intérêt de proposer des API pour les webmaster ? dans ce cas ou il y a forcément DC...
ça mélange tout sur ce fil .... Les Api webmaster genre twitter et cie sont des frames crées dynamiquement côté client via JS il n'y a donc aucun contenu dupliqué puisqu'il n'y a pas de contenu.
En cliquant sur un onglet on charge (par ajax) un fichier php qui s'affiche dans la page.
la page est la même pour l'utilisateur et le moteur on n'entre donc clairement pas dans la notion de cloaking. Ce qui se passe ensuite ne regarde pas les moteurs et la motivation qui pousse au dynamisme d'un page ne regarde pas GG.
j'ai vu une video de matt cutts de 2011 qui exliquait les raisons du cloaking qui sont tout à fait juste. C'est à dire que n'importe qui pourrai mettre n'importe quoi
le cloaking est utilisé parfois pour ajouter des variations a une page ... purement dans un esprit SEO genre transformer le gras en <h1> pour donner plus de poids aux mots etc ... mais là on est dans une logique ou le chargement de la page (sur un navigateur texte par exemple (cf wget aussi)) ne donne pas le même résultat si cela se passe chez un lambda ou depuis une IP GG.
Le cloacking implique nécessairement que tu traite certaines IP ou user Agent de façon différente. Si ce n'est pas le cas tu ne peux pas entrer dans le concept de cloaking.

Noren a dit:
Après comme indiqué je ne maitrise pas l'ajax
Ajax n'est en fait qu'un objet manipulé par javascript qui a la capacité interne de faire une requête sur le domaine père et de récupérer la réponse du domaine.
Il y a donc deux parties, le scrip javascript dans la page et le scrip php sur le serveur. L'un contacte l'autre qui lui répond et lui donne un contenu. Javascript permet ensuite d'inclure la réponse dans la page.

Code:
if(window.XMLHttpRequest){xhr=new XMLHttpRequest();}
else if(window.ActiveXObject){xhr=new ActiveXObject("Microsoft.XMLHTTP");}
xhr.open("GET","http://www.example.com/script-php-serveur.php",false);
xhr.send(null);
ce code javascript crée un objet ajax qui contacte l'url -http://www.example.com/script-php-serveur.php
Code:
obj=document.getElementById('maDiv');
obj.innerHTML = xhr.responseText;
ce code remplie <div id="maDiv"></div> avec ce que répond l'url côté serveur.
coté serveur le script "script-php-serveur.php" peut par exemple être ainsi ;
PHP:
<span class="syntaxdefault"><?php<br />    echo </span><span class="syntaxstring">'Ok ...'</span><span class="syntaxkeyword">;<br /></span><span class="syntaxdefault">?></span>
une fois le script ajax sollicité (onclik, onmouseover, etc ...) la div en question sera complétée :
Code:
<div id="maDiv">Ok ...</div>
le contenu est donc apparu côté client via un script serveur et ajax.

C'est relativement trivial dans le principe mais très puissant a l'usage. Attention a bien vérifier par qui et dans quel contexte est sollicité le script serveur ;-) car il est accessible en live vu qu'il doit être dans le champ d'action du serveur web. Il conviens donc que ces fonctions serveurs soit bien construites pour ne pas répondre comme des tanches a la moindre sollicitation directe d'un internaute malin.
 
WRInaute discret
zeb a dit:
Les Api webmaster genre twitter et cie sont des frames crées dynamiquement côté client via JS il n'y a donc aucun contenu dupliqué puisqu'il n'y a pas de contenu.
Tu sais même pas de quel api je parle à ce moment... et est ce que j'ai parlé de frames ??? tu t'emballes tout seul. (twitter plus bas est a titre d'exemple...)
zeb a dit:
la page est la même pour l'utilisateur et le moteur on n'entre donc clairement pas dans la notion de cloaking. Ce qui se passe ensuite ne regarde pas les moteurs et la motivation qui pousse au dynamisme d'un page ne regarde pas GG.
Faux la page est différente pour le moteur, il lui manque des informations.
zeb a dit:
... Le cloacking implique nécessairement que tu traite certaines IP ou user Agent de façon différente. Si ce n'est pas le cas tu ne peux pas entrer dans le concept de cloaking.
OK en effet mais ça n'empêche pas l'ajout de contenu pornographique pour duper le moteur...

Alors j'ai envie de dire si c'est une pénalité manuel, il seront plus indulgent mais si c'est algorithmique ça passera beaucoup moins bien.
 
WRInaute accro
Ce que nous essayons de t'expliquer c'est que du moment qu'il faut une action de la part d'un membre pour afficher le contenu dupliqué, il n'y a pas de cloaking et de risque vis a vis de google.
Tu n'affiches pas une page différente à google par rapport a tes visiteurs et tu ne caches rien à google.

merci zeb pour les infos ;) j'avais déjà commencé a lire quelques bouquins sur le l'ajax mais je n'ai pas encore pratiqué :mrgreen:
l'ajax est effectivement puissant mais à utiliser a bon escient :wink:
 
WRInaute discret
ok merci mais je reste septique. Vous avez peut être des exemples ?
Car le fait d'afficher du contenu pour l'internaute et de le cacher pour les moteurs c'est très très limite, enfin je m'y risquerais pas trop.
 
WRInaute accro
BoboAsh a dit:
zeb a dit:
la page est la même pour l'utilisateur et le moteur on n'entre donc clairement pas dans la notion de cloaking. Ce qui se passe ensuite ne regarde pas les moteurs et la motivation qui pousse au dynamisme d'un page ne regarde pas GG.
Faux la page est différente pour le moteur, il lui manque des informations.
Bah non, si tu compare la page en cache (donc vue du moteur) et la page obtenue après chargement (donc comme te l'explique Noren) tu n'as aucun différence. Cela comprend aussi les pages qui incluent un chargement de contenu via ajax sur le onload car la comparaison doit se faire avec javascript désactivé (donc sans action utilisateur ou automatique du navigateur)

Et sinon pour ce qui est des api a la con qui ne proposent pas leur contenu autrement que par une techno de frame (donc hors page) il est évident que c'est du DC mais je ne connais pas trop de maisons sérieuses qui proposent ça.

Dans les faits si le contenu "syndiqué" est chargé dans la page chez le client c'est obligatoirement par une technique qui va faire on-page un chargement depuis une url externe. Dans ce cas, le contenu est "invisible" des bots et ne participe donc pas au contenu => risque de DC néant.

A l'inverse si le contenu "syndiqué" est chargé en amont dans ta page (pour qu'il participe au contenu de celle ci) il faut obligatoirement que ce soit ton serveur qui aille le chercher, bref je ne connais pas beaucoup de webmaster qui accepterait de faire cela avec le risque de se retrouver avec un contenu hors contrôle dans leur page (pas cool pour l'utilisateur) ou sur leur système (bonjour le risque sécurité).

Bref soit tu n'est pas en DC soit tu est suicidaire. Je ne m’emballe pas c'est binaire :wink: .
 
WRInaute accro
BoboAsh a dit:
Car le fait d'afficher du contenu pour l'internaute et de le cacher pour les moteurs c'est très très limite, enfin je m'y risquerais pas trop.
Tu confond "cacher du contenu" et "ajouter du contenu".
 
Discussions similaires
Haut