"Le duplicate content n'est pas pénalisant"

WRInaute accro
Greg Grothaus, de l'équipe Qualité Google a publié une vidéo à propos du duplicate content et des divers problèmes dus aux sites multiples.

Une explication (en anglais) ici : http://www.webpronews.com/topnews/2009/09/16/google-busts-the-duplicat ... ntent-myth

Notamment, à propos du duplicate content :
"What's actually happening, is that we're looking at the query that the user's doing, and we're saying that we want diversity in the results we're going to show a user," says Grothaus. He says those who think their content is being omitted because it is duplicate, will likely find that if they adjust their query to more specifically reflect the missing piece, they may just find that it shows up in results after all.

"Ce qui se passe réellement, c'est que nous regardons la requête que l'utilisateur tape. Et nous disons que parmi les résultats à afficher, nous voulons de la diversité", dit Grothaus.
Il dit que ceux qui pensent que leur contenu est enlevé parce que c'est du duplicate content se rendront rapidement compte que si ils ajustent leur requête pour qu'elle soit plus précise et qu'elle reflète la "pièce manquante", ils se rendront compte que au final, cela s'affiche dans les résultats malgré tout.

Au final ce qu'il tente de faire passer comme message, c'est : "nous ne pénalisons pas les sites pour duplicate content. Mais vos sites peuvent ne pas apparaitre pour cette raison".
Personnelement, ne pas apparaitre parce que l'on fait du duplicate content, j'appelle ça de la pénalisation.

Je ne reporte pas le reste de l'article ici. Mais c'est assez intéressant. Notamment au niveau du rel="canonical" et du multi domaining.
 
WRInaute passionné
en gros, le DC, ce n'est pas une pénalité (volontaire) pour GG, juste un effet de bord...
moralité.. on joue avec les mots, mais le résultat est le même... DC = risque de ne plus apparaitre dans les results et tout ce que cela peut impliquer...
 
WRInaute accro
Il faut aussi relativiser, si le DC n'affecte pas forcément le référencement d'un site il faut aussi prendre en compte le DC générer sur des sites externes qui peuvent mieux se positionner que le site original, je pense notamment aux agrégateurs de type Paperbl0g qui peuvent rapidement devenir néfaste car il n'est plus nécessaire d'aller sur l'original dans ce cas.
 
WRInaute accro
On sait tous que le duplicate entraine des sanctions autre que l'ignorance de certaines pages sur certaines requête ... La communication Google, c'est du béton (je crains rien avec ce slogan ?).
 
WRInaute accro
Non justement, sauf si la majorité du site est en DC ce qui est souvent le cas des annuaires comme tu le sais. C'est d'ailleurs bien pour ça que l'on conseille de créer des descriptions uniques pour chaque annuaires pour un référencement optimal.
Pour prendre un exemple simple, les blogs de type WordPress ont du duplicate à cause des archives par tags/dates/catégorie cela n'empêche pas pour autant les articles d'exister dans les moteurs cependant ces pages sont misent à l'écart.
 
WRInaute accro
Bien que parfois ces pages prennent le dessus et l'article ne sort que ndans les résultats ignorés, tu ne me diras pas que tu ne l'as pas déjà constaté. Mais bon, la on est sur deux duplicate totalement différent. Le filtre ne réagit pas du tout pareil suivant si le contenu est dupliqué en interne ou en externe.
 
WRInaute accro
Audiofeeline a dit:
Non justement, sauf si la majorité du site est en DC ce qui est souvent le cas des annuaires comme tu le sais. C'est d'ailleurs bien pour ça que l'on conseille de créer des descriptions uniques pour chaque annuaires pour un référencement optimal.

Et les petits annuaires ont tous sauté, juste quelques gros jugé (à tord ou à raison, les critères sont un peu flous) de confiance sont restés.

Remarque, quand des sites descendent sur des requuêtes de 200 places d'un coup, une demande réinsertion donne aussi "rien trouvé sur le site".
 
WRInaute accro
Jean-Bertrand a dit:
Google ne sait pas encore comment gérer le duplicat content comme pas mal de choses.
Je ne suis pas d'accord, Google arrive à faire le tri entre les copies et les originaux celà dit c'est aux SEO de s'appliquer pour les annuaires... :evil:
 
WRInaute passionné
Merci kazhar,
Je pense que GG à raison de ne pas faire apparaitre les pages dupliquées, c'est une question de bon sens.
Imaginez la qualité des Serps sans un filtre de DC, alors oui ca peut parraitre pénalisant pour un webmaster , mais pas pour l'utilisateur final qui est la cible du moteur.


@Audiofeeline : je pense également que GG à des problèmes pour gerer le DC.
 
WRInaute accro
saypee a dit:
Merci kazhar,
Je pense que GG à raison de ne pas faire apparaitre les pages dupliquées, c'est une question de bon sens.
Imaginez la qualité des Serps sans un filtre de DC, alors oui ca peut parraitre pénalisant pour un webmaster , mais pas pour l'utilisateur final qui est la cible du moteur.


@Audiofeeline : je pense également que GG à des problèmes pour gerer le DC.
dOMMAGE que Google ne garde pas souvent l'original mais bien les copies.
 
WRInaute accro
déjà comment google fait la différence entre de la simple copie, et de la déduction similaire d'un individu à un autre:

par exemple moi et mon WWW, je ne vais pas sur les site des autres/concurrents et encore moins copier leurs rédactionnels(et ses tout à mon honneur), déjà parce que je suis un gros fainéant :mrgreen: et que j'ai pas que ça à foutre, je ponds mon rédactionnel en fonction des avis et conseils de mes clients, ou des conseils aviser des webmaster et aussi des avis que me donne des outils comme gnoztik(qui est un espion sur les mots, mais pas sur les phrases), moi je demande à mes clients se qu'ils tapent dans les moteurs de recherche, savoir ils tapent plus "depannage" que "reparateur" ou "maintenance", qu'il semble plus taper "paris" que "domicile", et que mes clients auront plus tendance à taper 2 mots clé que trois, voire que le troisième mots sera le plus souvent celui de leur localité(ex: "PARIS"), qu'en fonction de cela je ponds un rédactionnel diffèrent pour les annuaire et aussi un pour la page d'accueil de mon site.

Partant de la je peux très bien pondre un contenu rédactionnel quasi identique à un autre site, qui l'a mis en publication bien avant moi, et qu'en plus se site pour divers raison ancienneté et/ou PR ou TR(trust Rank) et autre dichotomie verbale googlolienne, est dans les petites papier de google et que se dernier y accorde à tord ou à raison une plus grande confiance; partant de cela google me déclasse, ben oui j'aurai copier à ses yeux l'autre site soit disant auteur original, hors moi n'en sachant rien j'aurai penser à tord être le seul auteur de mon contenu rédactionnel de mon WWW, pendant se temps là je serai sanctionner, moi de mon coté je dis juste une chose pour mon activité y a pas 36 mille façon d'attirer le chaland et que si on se ressemble tous ce n'est pas que parce que l'on copierait les uns sur les autres, mais uniquement parce que nos clients et nos visiteurs on une façon bien à eut de parler la langue française et de raisonner et de taper plus certains mots ou groupes de mots que d'autres, d'où une tendance à une forte ressemblance dans les contenue rédactionnel et notamment dans les accroches publicitaires.

enfin je dis ça, je dis rien hein !!!!!
 
Nouveau WRInaute
Ma petite théorie

Je suis tout-à-fait d'accord avec kazhar, les moteurs sont avant tout conçus pour les utilisateurs qui cherchent une information et non pour les référenceurs.
Il est donc normal que Google présente sur sa première page un éventail des résultats dans plusieurs contextes et évite les DC. Comme ça, chaque internaute a des chances de trouver ce qu'il cherche.

On peut le voir facilement en cherchant des mots comme Rose, Marguerite, Marie qui donnent des résultats très variés.

Par contre, j'ai une petite théorie sur le sujet qu'il serait intéressant de vérifier.

Je pense que la présence d'adwords dans un contexte déterminé influence les résultats :

Lorsqu'on fait une recherche sur fenêtres, les adwords présents ne parlent que de fenêtres dans le contexte "maison" et pas dans le contexte "informatique". Du coup ce sont aussi les résultats dans le contexte maison qui apparaissent majoritairement dans les résultats naturels.

Idem pour une recherche sur avocats.

La recherche sur le mot Home montre aussi la prédominance des résultats qui traitent du film, comme dans les adwords, alors que c'est un mot utilisé sur des milliards de pages.

Cela voudrait dire que si vous voulez vous positionner sur un mot utilisé dans plusieurs contextes, il y a interêt à mettre des adwords en parallèle pour faire ressortir ce contexte dans les résultats naturels.

Ce n'est qu'une simple théorie , mais vous avez peut-être des exemples qui vont dans ce sens ?
 
WRInaute accro
il y a des adwords parce que sur cette requête, c'est ce type d'entreprises que recherchent les internautes en général. GG mettait peut-être des sites sur les fenêtres informatiques mais ça n'était pas cliqué, donc pas d'intérêt de les garder dans les 1° pages des SERP
les adwords fonctionnent en sens inverse de ce que tu crois : comme les internautes sont intéressés par les recherches naturelles dans une thématique sur une requête précise, alors ça vaut le coup d'afficher des pubs et pas le contraire
 
Nouveau WRInaute
Leonick a dit:
il y a des adwords parce que sur cette requête, c'est ce type d'entreprises que recherchent les internautes en général. GG mettait peut-être des sites sur les fenêtres informatiques mais ça n'était pas cliqué, donc pas d'intérêt de les garder dans les 1° pages des SERP
les adwords fonctionnent en sens inverse de ce que tu crois : comme les internautes sont intéressés par les recherches naturelles dans une thématique sur une requête précise, alors ça vaut le coup d'afficher des pubs et pas le contraire

Rassure-toi, je pratique les Adwords depuis de nombreuses années et je sais très bien comment cela fonctionne...

Je donne un autre exemple:

Si je fais une recherche sur fer, j'obtiens des résultats dans différents contextes : chemin de fer, le fer dans l'alimentation, ...
Il n'y a quasiment pas d'adwords qui apparaît pour ce mot.

Maintenant si je regarde les mots clés les plus demandés par les internautes, je trouve "fer forgé" qui est vraiment très recherché. Or aucun site sur la thématique "fer forgé" n'apparaît bien placé dans les résultats naturels, ce qui contredit ce que tu disais dans ton message.
On peut donc se demander pourquoi certaines thématiques sont favorisées par rapport à d'autres ?


Ma question est la suivante: Si tout à coup plusieurs sociétés mettent des Adwords en place sur le mot clé "fer forgé", est-ce que cela va influencer la classification des résultats naturels sur la recherche fer? Est-ce que du coup, des sites traitant de "fer forgé" vont apparaître sur la première page ?

Je pense que oui, mais je ne l'ai pas testé.
 
WRInaute accro
domino a dit:
Maintenant si je regarde les mots clés les plus demandés par les internautes, je trouve "fer forgé" qui est vraiment très recherché. Or aucun site sur la thématique "fer forgé" n'apparaît bien placé dans les résultats naturels, ce qui contredit ce que tu disais dans ton message.
non, justement.
Si tu as vu que la requête "fer forgé" était très recherchée, c'est parce que les internautes tapent "fer forgé".
S'ils ne tapent que "fer", cela a plus à voir avec l'alimentation. d'où les requêtes similaires affichées en bas de page "Recherches apparentées à : fer"
 
Nouveau WRInaute
Leonick a dit:
non, justement.
Si tu as vu que la requête "fer forgé" était très recherchée, c'est parce que les internautes tapent "fer forgé".
S'ils ne tapent que "fer", cela a plus à voir avec l'alimentation. d'où les requêtes similaires affichées en bas de page "Recherches apparentées à : fer"

Alors les sites traitant de "chemin de fer" ne devraient pas apparaître non plus ...

Je vois que je ne pourrai pas te convaincre. Je ferai un test quand j'aurai un site et des mots clés qui s'y prêtent. :D
 
WRInaute accro
Ce n'est pas si simple. Un contenu peut être indexé en second mais être l'original tout de même.
Notamment dans le cas d'articles d'actualité, qui peuvent être repris par des dizaines de sites dans les 10 minutes après leur publication.
Impossible alors de déterminer l'auteur original en se basant sur la date d'indexation.
 
WRInaute discret
Dans tous les cas d'après les nombreux tests que nous avons entrepris à ce sujet GG prend comme original celui qu'il a indexé le premier dans sa base !
 
WRInaute accro
jlepine a dit:
Google prend comme original celui qui a la date la plus ancienne dans sa base de données ! Simple et logique !

C'est une blague?

Evite la logique quand on parle de pénalités (merci). On a fait un tests ici il y a un an avec un de mes site et la même phrase sur WRI quelques mois plus tard
https://www.google.be/search?q=%22D%C3%A9sol%C3%A9,+mais+notre+syst%C3% ... 5&filter=0 Cherche pas l'original, j'ai supprimé le site.

On a aussi débloqué l'année dernière un paquet de petits sites de vente en ligne qui vendaient sur e-bay (ou autres sites d'annonces) avec leur propre contenu (en réfléchissant, ... les c*on :oops: )
 
WRInaute accro
jlepine a dit:
Dans tous les cas d'après les nombreux tests que nous avons entrepris à ce sujet GG prend comme original celui qu'il a indexé le premier dans sa base !
Quels sont ces tests, aurais tu un lien ? Car j'ai plutôt des tests qui nous donnent le résultat inverse à savoir qu'il n'y semble y avoir de règle mesurable.
 
WRInaute accro
Pour ma part je ne "lutte" plus contre ce phénomène, je fais simplement un spam report quand c'est abusé et puis c'est tout.
Je ne pense pas qu'il faut perdre son temps avec ça, un MFA n'obtiendra que très rarement des liens naturels c'est ce qui fait la différence avec nos sites (pour la plupart).
 
WRInaute occasionnel
L.Jee a dit:
jlepine a dit:
Dans tous les cas d'après les nombreux tests que nous avons entrepris à ce sujet GG prend comme original celui qu'il a indexé le premier dans sa base !
Quels sont ces tests, aurais tu un lien ? Car j'ai plutôt des tests qui nous donnent le résultat inverse à savoir qu'il n'y semble y avoir de règle mesurable.
J'ai aussi, non pas des tests, mais des expériences malheureuses qui contredisent les affirmations hâtives de jlepine.
 
WRInaute impliqué
Ma question est la suivante: Si tout à coup plusieurs sociétés mettent des Adwords en place sur le mot clé "fer forgé", est-ce que cela va influencer la classification des résultats naturels sur la recherche fer? Est-ce que du coup, des sites traitant de "fer forgé" vont apparaître sur la première page ?
Mais il y a déjà beaucoup de sociétés qui mettent en place des adwords sur l'expression "fer forgé", et pourtant cela n'influence pas les positions de la requête "fer"...
 
Nouveau WRInaute
Argonaute a dit:
Mais il y a déjà beaucoup de sociétés qui mettent en place des adwords sur l'expression "fer forgé", et pourtant cela n'influence pas les positions de la requête "fer"...
Je me suis mal exprimée :oops:
Je voulais dire :
Si tout à coup plusieurs sociétés dans la thématique "articles en fer forgé" mettent des Adwords en place sur le mot clé "fer", est-ce que cela va influencer la classification des résultats naturels sur la recherche "fer"? Est-ce que du coup, des sites traitant de "fer forgé" vont apparaître sur la première page ?
 
WRInaute passionné
Audiofeeline a dit:
Pour ma part je ne "lutte" plus contre ce phénomène, je fais simplement un spam report quand c'est abusé et puis c'est tout.
Je ne pense pas qu'il faut perdre son temps avec ça, un MFA n'obtiendra que très rarement des liens naturels c'est ce qui fait la différence avec nos sites (pour la plupart).

un gros +1 avec toi Audiofeeline ... cependant si on fait tous comme ca dans les differents domaines du SEO (ce qui est de + en + mon cas) c'est la mort de WRI assuré :)
 
WRInaute accro
domino a dit:
Si tout à coup plusieurs sociétés dans la thématique "articles en fer forgé" mettent des Adwords en place sur le mot clé "fer", est-ce que cela va influencer la classification des résultats naturels sur la recherche "fer"? Est-ce que du coup, des sites traitant de "fer forgé" vont apparaître sur la première page ?
s'ils ne sont pas cliqués par les internautes, ça ne changera rien du tout, sauf le CPC qui montera en flèche au vu d'un CTR très (trop) faible
 
Nouveau WRInaute
Leonick a dit:
domino a dit:
Si tout à coup plusieurs sociétés dans la thématique "articles en fer forgé" mettent des Adwords en place sur le mot clé "fer", est-ce que cela va influencer la classification des résultats naturels sur la recherche "fer"? Est-ce que du coup, des sites traitant de "fer forgé" vont apparaître sur la première page ?
s'ils ne sont pas cliqués par les internautes, ça ne changera rien du tout, sauf le CPC qui montera en flèche au vu d'un CTR très (trop) faible

Et s'ils sont cliqués ?
 
WRInaute accro
domino a dit:
Et s'ils sont cliqués ?
si les sites de fer forgé intéressaient les internautes qui tapent "fer" comme requête, ils iraient bien au delà de la 1° page des SERP. Si la proportion de ces internautes devenait plus forte, gg modifierait ses SERP et, dans un premier temps, la liste des requêtes connexes affichée en bas de 1° page. Ce qui n'est pas le cas :wink:
 
Nouveau WRInaute
OK rien de suprenant dans cette vidéo...mis a part que je prend un coup de vieux quand j'imagine l'âge du garçon...;-)

Mais j'ai le cas des communiqué de presse financier des boites coté en bourse que je ne comprend pas ces communiqués sont repris à l'identique sur des centaines de sites et ne passent pas en duplicate content? vous avez des explcations à ce cas?
 
WRInaute accro
Non pas du tout, si les choses sont faites intelligemment il n'y a pas de raisons de s'inquiéter, les cas les plus graves sont lorsque que le contenu dans sa totalité est repris ailleurs. S'il y a un bon lien et si seul un extrait est repris ça ne me dérange pas plus que ça, il y a de plus en plus d'agrégateurs, il faut faire avec je pense.
 
WRInaute accro
domino a dit:
Leonick a dit:
Maintenant si je regarde les mots clés les plus demandés par les internautes, je trouve "fer forgé" qui est vraiment très recherché. Or aucun site sur la thématique "fer forgé" n'apparaît bien placé dans les résultats naturels, ce qui contredit ce que tu disais dans ton message.
On peut donc se demander pourquoi certaines thématiques sont favorisées par rapport à d'autres ?


Ma question est la suivante: Si tout à coup plusieurs sociétés mettent des Adwords en place sur le mot clé "fer forgé", est-ce que cela va influencer la classification des résultats naturels sur la recherche fer? Est-ce que du coup, des sites traitant de "fer forgé" vont apparaître sur la première page ?

Je pense que oui, mais je ne l'ai pas testé.

je pense aussi que fer forgé est demandé. Pour la classification, GG dit que non. En pratique, j'hésiterais mais pas dans ton sens. Tu risque de voire apparaître des pages venant de presque nulle part avec des adsences (juste une ou deux dans les 10 premiers). C'est juste une opinion :wink:

D'aillieurs, le titre du post est "le duplicate n'est pas pénalisant" et on sait que OUI (et Google dit finalement que non). Les vedettes de Google devraient arrêter de s'occuper de grater les détails et s'occuper de postionner correctement les résultats, ccomme en 2006 (et pour reprendre un MP, des googleboys viennent aussi sur WRI).
 
Olivier Duffez (admin)
Membre du personnel
J'ai tenté de faire une petite synthèse sur le thème "Duplicate content et référencement".

Bonne lecture et merci pour vos éventuelles remarques et suggestions d'améliorations de l'article.

Edit : je ne trouve pas que Twitter ait eu une bonne idée de tronquer les URL de bit.ly :

merci pour les premiers retweets
 
Discussions similaires
Haut