Danger de duplication de pages pas encore indexées ?

Nouveau WRInaute
Bonjour,

Si un nouveau site est publié, ses pages ne sont pas immédiatement indexées par Google.
J'ai déclaré un fichier sitemap il y a quelques jours mais ses pages ne sont toujours pas indexées (bien que le sitemap soit lu correctement).
:?: Est-ce que si le contenu d'une page non encore indexée est copié par un autre site, cet autre site pourrait être reconnu comme auteur, original, ... ?
Mon site, ma page, serait alors du duplicated content (alors que c'est en réalité l'original). Cet autre site pourrait faire indexer la page recopiée plus rapidement parce que le site ne serait pas neuf, ...

Merci de votre aide et réponse.
 
WRInaute accro
Oui c'est tout a fait possible et d'autant plus probable que le site copieur sera plus ancien et mieux trusté que ton nouveau site par définition ...

Que faire : si ton site fait 30 pages, je crains que tu ne puisses pas faire grand chose ... Si ton site comporte beaucoup de pages (des milliers, dizaines de milliers ou centaines de milliers) excluant le copier coller manuel et necessitant donc le recours a des aspi : met en place un tracking et un ban ip des que ca aspire trop vite et trop fort (ca limitera la casse)
 
WRInaute accro
Zecat a dit:
Oui c'est tout a fait possible et d'autant plus probable que le site copieur sera plus ancien et mieux trusté que ton nouveau site par définition ...

Non, on ne sait pas réellement pourquoi avec le même contenu, GG fait passer une page et pas l'autre: ce n'est pas l'ancienneté de toute façon. Probablement plus une espèce de trustrank.
 
WRInaute accro
Zecat a dit:
c 'est pour cela que j'ai dit "mieux trusté" ... :wink:
Là aussi , c'est encore plus complexe que cela (mais la ligne directrice est là). C'est d'ailieurs la PRINCIPALE raison pour laquelle on demande aux nouveaux de ne pas mettre leur contenu (même une petite phrase) sur le Forum de WRI, à tous les coups, c'est le forum qui passe.

MAis déjà vu (cf. L'Jee avec Costaud.net qui s'était fait copié son annuaire par exemple) un petit site qui débute qui fait s'écrouler un site qui a 3 - 4 ans ou plus. L'idée de trustrank n'a jamais été réellement expliquée par GG, c'est une espèce d'explication des référenceurs quand ils ne savent pas. :oops:

zedo24 a dit:
:?: Est-ce que si le contenu d'une page non encore indexée est copié par un autre site, cet autre site pourrait être reconnu comme auteur, original, ... ?

On reprend: il n'y a aucune règle (c'est bien ce qu'on reproche à Google). Un petit site peut copier un article très ancien sur un très gros site et passer (mais ce n'est même pas garantit que le petit restera debout longtemps) ou complètement l'inverse. Il n'y a aucune anciennenté d'indexation qui fait passer le premier devant le deuxième ... (je vais pas reprendre le paquet d'article qu'on a fait à quelques uns sur ce forum depuis https://www.webrankinfo.com/forum/les-penalites-google-octobre-2007-sept-20 ... 99511.html plus les tests de 2009). Pour rappeler et positionner quand même le problème, un des membres de l'équipe de tests de 2008 reprend sur son site les contenus d'un site disparu depuis plus de 3 ans .... et son site (pourtant ancien avec beaucoup de contenu "propre") disparaît complètement en quelques semaines de Google. Ca donne une idée ? Personnellement sur un site "cassé" par Google dans sa partie annuaire, Je reprenais une petite phrase quand je supprimais la description d'un site avec une description dupliquée (en laissant le site dans l'annuaire avec son titre et son lien). Et j'ai fait un petit essais, mis cette phrases dans le café de WRI mélangé à du contenu anodin et ... sur la phrase, WRI devant (et les quelques pages de l'annuaires qui "survivaient" encore ont disparues du cache de Google. Avec des descriptions dupliquées dans les annuaires, certains annuaires sortaient souvent dans les résultats, quelques uns de temps en temps et d'autres se sont ramassé une claque sur toutes les fiches .... C'est là qu'on a repris comme explication un espèce de trustrank (un genre de PR lié à une espèce de notoriété du site pour Google), on passage, c'est aussi l'explication donnée par les référenceurs aux premières positions de Wikipédia (c'est peut-être en partie vraie mais une analyse des liens Internes de ce site, + beaucoup de contenus, + le système "social", ..... peut donner beaucoup de raisons, y compris celui proné par des référenceurs avec les liens en nofollow - un paquet de spéculations).

Pour résumer la question, un des site peux passer (et pas l'autre) sans idée d'ancienneté de la page ou du nom de domaine, sans non plus le PR ... (dépassé: mais de toute façon, les pages sanctionnées pour duplicate finissent généralement grisées en PR et même plus dans le cache .... mais connues et suivies au niveau des liens par Google), les liens externes sur la page dégrisent le PR affiché des pages sanctionnées pour duplicate mais quasiment jamais ne permettent un positionnement de la page , .... Aucune réponse logique à te donner :wink:
 
Discussions similaires
Haut