Comment Google détecte-t-il le duplicate content ?

Nouveau WRInaute
Bonjour tout le monde,

Une question me taraude aujourd'hui ! Je voudrais en effet en savoir un peu plus sur le duplicate content "hostile" (un site B pompe du contenu d'un site A), et surtout sur la manière dont les moteurs (et notamment Google) s'y prennent pour statuer sur le publieur originel.

Car s'il existe un certain nombre de solutions pour indiquer aux moteurs quel contenu prendre en compte quand, pour une raison ou pour une autre, on est à l'origine du duplicate content (attribut canonical notamment), dans le cas contraire, le moteur doit pénaliser le fautif (ce qui est normal).

A ce titre, j'ai récemment lu que Google se contenterait souvent de pénaliser la page au PR le plus faible, comme si la popularité d'un site permettait d'affirmer qu'il ne pompe pas. J'avoue que ça me surprend un peu de la part de Google, qui nous a habitué à plus malin que ça 8O.

Ne serait-il pas plus judicieux de donner la priorité à celui qui a amené le premier ce contenu à la connaissance du moteur ?

Qu'en pensez-vous ?
 
WRInaute passionné
Plusieurs éléments seraient pris en compte, comme la date de première indexation, les dates des liens, le fait que la source soit mentionnée etc. mais ce n'est pas parfait. Dans certains cas les sites à gros PR vont cependant ressortir à la place du site source à faible PR. C'est typique de certains gros agrégateurs par exemple. Ce n'est pas voulu par le moteur, c'est juste que le petit site n'a pas réussi à prouver son antériorité. Aucune pénalité là dedans, Google doit choisir une page parmi plusieurs versions. Il essaie de chosir la bonne, mais se plante parfois :)
 
WRInaute accro
schwipps a dit:
A ce titre, j'ai récemment lu que Google se contenterait souvent de pénaliser la page au PR le plus faible, comme si la popularité d'un site permettait d'affirmer qu'il ne pompe pas. J'avoue que ça me surprend un peu de la part de Google, qui nous a habitué à plus malin que ça 8O.

Ne serait-il pas plus judicieux de donner la priorité à celui qui a amené le premier ce contenu à la connaissance du moteur ?

te rassure (plutôt pas) ce n'est pas le PR qui joue. (et il est bien moins malin que ça). Pour le premier non plus, GG n'a aucune coonfiance dans ses robots.
French Dread a dit:
Plusieurs éléments seraient pris en compte, comme la date de première indexation, les dates des liens, le fait que la source soit mentionnée etc. mais ce n'est pas parfait. Dans certains cas les sites à gros PR vont cependant ressortir à la place du site source à faible PR. C'est typique de certains gros agrégateurs par exemple. Ce n'est pas voulu par le moteur, c'est juste que le petit site n'a pas réussi à prouver son antériorité. Aucune pénalité là dedans, Google doit choisir une page parmi plusieurs versions. Il essaie de chosir la bonne, mais se plante parfois :)
La date de première indexation non plus (il y a plus d'un an, j'ai fait des tests dans le café de WRI avec des pages datant de plus de 6 mois et ce sont les pages originales qui sont passées à la trappe mais le site n'était déjà pas trop bien vu de GG).
Les dates de liens peut-être (mais rien n'est prouvé) et ca ne joue que sur des vielles pages (mais GG garde en mémoire les versions des vieilles pages). Ce n'est pas le PR qui fait ressortir les pages mais une sorte de "niveau de confiance" complètement débile (sauf que L'jee s'est fait copier des descriptifs de son annuaire par un débutant et s'est fait aussi cassé)


Aucune pénalité là dedans, Google doit choisir une page parmi plusieurs versions. Il essaie de chosir la bonne, mais se plante parfois :)
. Pénalité pour celui qui copie non. Pour celui qui est copié oui (je suis un peu moraliste dans ma réponse :wink: ).

C'est justement le problème depuis prêt de deux ans, c'est que Google ne gère (sais pas) gérer le duplicate.
> French Dread: désolé :wink: mais ce problème n'a pour l'instant pas de réelles réponses pour les webmasters: il n'y a aucune logique (AUCUNE)
 
Nouveau WRInaute
Donc qu'est ce qu'on peut faire, selon vous, pour s'en prémunir ? Y a-t-il des éléments qu'on puisse soumettre à Google, ou insérer dans nos pages, pour l'aider à mieux trancher ?
 
Discussions similaires
Haut