Google reprend-il le Whois ?

  • Auteur de la discussion Auteur de la discussion Aye-Aye
  • Date de début Date de début
WRInaute passionné
Cette question a été posée à plusieurs reprises et Wri s'était exprimé :
WebRankInfo a dit:
Google ne vérifie pas les WHOIS (en tout cas je n'en ai pas vu la preuve). Par contre il pourrait se baser sur les adresses IP des serveurs. Là aussi c'est au conditionnel, et je ne pense pas qu'avoir quelques sites sur la même adresse IP puisse être pénalisant.
:arrow: (citation datant de 2004)
Pourtant, j'ai comme l'impression qu'une description d'une de mes url est inspirée par un élément externe.... comme le whois.
Qu'en pensez-vous ?
Avez-vous des infos en la matière ?
(On connait déja bien sûr le pb des bl issus de sites de même classe C... ) ...mais avez vous d'autres infos qui pourrait confirmer ou infirmer mon opinion ?
 
WRInaute impliqué
oui tout a fait l'ip du whois est un des critères de classement, et d'ailleurs, il faut éviter de lier trop fortement entre eux des sites hébergés sur la meme ip.

Les données du whois, telle que la stabilité dans le temps des infos sur le propriétaire du site sont aussi un des critères. Il y a un an environ j'étais tombé sur un mini dossier très intéressant sur les différents critères pris en compte. A chaque fois que ressort un topic sur le whois et son influence sur le ref, je regrette de ne plus me souvenir du site sur lequel je l'avais vu
mais ce qui en ressortait :

1- le whois est un des nombreux critères pris en compte (mais dans quelle proportion ??)

2- Google favoriserait des ip correspondant à des hébergeurs de confiance et à contrario, il y aurait une liste d'ip pénalisées, avec retour à une période "probatoire" du site. Cela va aussi dans le sens de certains qui disent qu'un nom de domaine enregsitré pour plusieurs années est préférable à un nom de domaine enregistré pour un an

3- un changement trop fréquent dans les infos du nichanddle, nicname... est surveillée également. Le dossier indiquait qu'a chaque changement de ces infos, c'est comme si le whois était remis à zero pour google.

4- cela confirme l'importance du critère temps et de la stabilité dans le temps d'un site
 
WRInaute passionné
code a dit:
A chaque fois que ressort un topic sur le whois et son influence sur le ref, je regrette de ne plus me souvenir du site sur lequel je l'avais vu...
Oui cela serait pas mal... que tu nous guides vers cet article...

PS : je précise que bien sûr la description en question ne vient pas de DMOZ....
 
WRInaute impliqué
Aye-Aye a dit:
code a dit:
A chaque fois que ressort un topic sur le whois et son influence sur le ref, je regrette de ne plus me souvenir du site sur lequel je l'avais vu...
Oui cela serait pas mal... que tu nous guides vers cet article...

PS : je précise que bien sûr la description en question ne vient pas de DMOZ....

Comme je l'ai dit, je suis inccapable de m'en souvenir. Je pensais meme l'avoir imprimé mais il reste introuvable. J'ai eu beau rechercher sur google, je ne suis jamais retombé dessus.
 
WRInaute impliqué
TOMHTML a dit:
et je ne pense pas qu'avoir quelques sites sur la même adresse IP puisse être pénalisant.
FAUX !
je viens de voir le contraire sur un blog il y a... 30 secondes environ
:D
>>>> http://www.wolf-howl.com/?p=369

Oui c'est connu qu'avoir des site sur la meme ip est pénalisant, dans la mesure ou ils sont fortement liés en entre eux (échange de lien sur toutes les pages par exemple). Mais s'ils ne sont pas liés (ou par une seule page partenaire par exemple) c'est pas bien grave (sinon tous les mutualisés d'un même hébergeur seraient pénalisés ;))
 
WRInaute passionné
Je pense qu'il voit les whois, sinon comment ferait-il pour mettre le Pr et les backilinks a 0 quand un domaine expire.
 
WRInaute accro
oui mais là à part l'IP ces sites n'ont RIEN en commun, et pourtant un site a la description de l'autre...
 
WRInaute passionné
TOMHTML a dit:
oui mais là à part l'IP ces sites n'ont RIEN en commun, et pourtant un site a la description de l'autre...
Ce qui me fait dire qu'il peut se servir du Whois, c'est tout simplement que des infos relatives à l'entreprise et au directeur de publication du site ... ne figurent pas ni dans le site ni sur l'url analysés...
Voilà, le cas ne relèverait pas d'un bug d'ip mais bien d'une exploitation délibérée d'infos externes.... :roll:
 
WRInaute discret
Pour ma part c'a fait un moment que je dis que le whois est pris en compte (à moindre pondération bien sûr) par gg ne serait-ce que pour la date d'expiration du domaine...
 
WRInaute passionné
Aye-Aye a dit:
Pourtant, j'ai comme l'impression qu'une description d'une de mes url est inspirée par un élément externe.... comme le whois.

Peux tu nous en dire un peu plus??

la citation d'Olivier date de 2004, ça eu le temps d'évoluer depuis...
 
WRInaute accro
hop hop. moi j'ai 50 sites sur la même IP, certains se font des liens entre eux, et je n'ai aucun soucis de référencement, aucune pénalité.
ça ca pourrai faire une bonne étude de cas
 
WRInaute accro
Ouai, ça me parait bizarre quand même que les moteurs de recherche pénalise les sites ayant la même adresse ip..à voir..

Le nom de domaine me semble déjà très significatif...
 
Olivier Duffez (admin)
Membre du personnel
c'est vrai que depuis qu'on a vu que Google était accrédité par l'ICANN on n'a jamais pu savoir comment il avait exploité les infos auxquelles il a accès.

Pour le coup de la pénalisation des sites sur la meme IP, bien que sous certains aspects cela puisse sembler logique, je n'ai jamais vu d'exemple concret qui soit probant...

A ce propos "code", pourrais-tu préciser ce que tu appelles "fortement liés" (simplement liens sur chaque page vers la home ?)
 
WRInaute accro
Aye-Aye> ces informations apparaiissent sur l'animation flash. et si google lisai le flash ? apres tout, l'url indéxée est un xwf, pas uen page web. possible qu'il lise et indexe le contenu flash, non ?
 
WRInaute passionné
e-kiwi a dit:
Aye-Aye> ces informations apparaiissent sur l'animation flash. et si google lisai le flash ? apres tout, l'url indéxée est un xwf, pas uen page web. possible qu'il lise et indexe le contenu flash, non ?
Google parse trés bien ... le texte statique figurant dans les fichiers flash (swf).
Pour le site en question, le texte est parsé d'ailleurs pour les animations de niveau 0 (fichiers swf de base) et les fichiers de niveau 1 (animations swf appelées par le fichier flash de niveau 0)....
.... Mais, la description figurant sur la requête (que je ne fournis qu'en mp) ne correspond pas au texte statique figurant dans mes animations...
Le informations fournies me laissent penser qu'elles ont issues du WHOIS... Je t'invite e-kiwi à regarder de plus près ce cas...
 
WRInaute impliqué
WebRankInfo a dit:
A ce propos "code", pourrais-tu préciser ce que tu appelles "fortement liés" (simplement liens sur chaque page vers la home ?)

Oui c'est cela.
il me semble que lorsque 2 sites qui sont sur la meme ip, pratiquent un échange de liens sur toutes leurs pages (dans le footer par exemple), sans dire qu'il va y avoir pénalité, je pense que cela a un effet moins bénéfique que si les 2 sites en questions étaient sur une ip différente. Ce phénomène est aggravé s'il s'agit de 3, 4, 5 sites et non 2 qui pratiquent l'échange de liens sur toutes les pages entre eux.
 
WRInaute passionné
Webrankinfo m'a convaincu de l'erreur que j'ai dû commettre.
La description dont mon fichier swf a hérité, qui ressemble à s'y méprendre à des infos du whois, proviennent vraisemblablement d'une ancienne mouture de mes animations Flash et notamment d'un fichier swf de niveau 1.
Sa démarche a été la suivante : interroger Google à l'aide de la commande :
Code:
filetype:swf  "directeur de publication"
pour vérifier si d'autres animations pouvaient avoir hérité d'une telle description. Force est de constater que toutes les animations flash présentes contiennent en texte statique l'expression 'directeur de publication' et donc mon hypothèse est proprement infirmée...
Je vais devoir maintenant rechercher dans mes anciennes moutures en sachant que le fichier flash a du être parsé en juillet 2005... :roll:
La question reste pertinente mais ma contribution est nulle et non avenue. :|
 
WRInaute passionné
non c'etait une etude interessante en tout cas, avec un cas precis, meme si j'ai pas trop eu le temps de me pencher dessus.
 
WRInaute accro
Je suis d'accord avec AW, perso, ça m'a permis de me remémorer (et découvrir) d'autres infos intéressantes :wink:

D'ailleurs même si tu as résolu semble-t-il ton problème, la question reste toujours posée :
Google accrédité par l'ICANN, utilise-t-il le whois et si oui dans quels buts et comment ?

La question me semble assez bien analysée sur le blog de Jim Boykin
 
WRInaute accro
dd32 a dit:
D'ailleurs même si tu as résolu semble-t-il ton problème, la question reste toujours posée :
Google accrédité par l'ICANN, utilise-t-il le whois et si oui dans quels buts et comment ?

La question me semble assez bien analysée sur le blog de Jim Boykin
Merci pour ce lien. C'est un excellent article.

J'ajouterais un point qui n'est pas couvert dans l'article. C'est l'utilisation par Google des données whois pour découvrir les nouveaux domaines. Quand on achète un nouveau domaine en .com, par exemple, le robots.txt et la page d'accueil sont visités par Google dans les 48 heures, même si aucun lien ne pointe vers le site. Je suis convaincu qu'il s'agit d'une utilisation des infos whois dont ils sont registrar, car cette visite ultra-rapide n'intervient pas pour les sites en sous-domaines, ni pour les sites avec des noms de domaine nationaux (.fr, .be,...).

Jean-Luc
 
WRInaute impliqué
ça vient d''arriver à un de mes sites, j'avais tagué en noindex le temps de mettre les pages propres. Et maintenant malgré des liens et tout le bins pour me signaler, j'ai pas revu le ggbot... :?
 
WRInaute accro
jeanluc a dit:
J'ajouterais un point qui n'est pas couvert dans l'article. C'est l'utilisation par Google des données whois pour découvrir les nouveaux domaines. Quand on achète un nouveau domaine en .com, par exemple, le robots.txt et la page d'accueil sont visités par Google dans les 48 heures, même si aucun lien ne pointe vers le site. Je suis convaincu qu'il s'agit d'une utilisation des infos whois dont ils sont registrar, car cette visite ultra-rapide n'intervient pas pour les sites en sous-domaines, ni pour les sites avec des noms de domaine nationaux (.fr, .be,...).
C'est très fort probable, +1.
 
WRInaute accro
Merci Jean Luc pour l'ajout :wink:

A vrai dire, j'étais tombée sur des topics (WRI) où certains affirmaient être dans Google sans aucun BL.
Ce qu'on peut comprendre en se basant sur ce qu'Erazor avait écrit:
Erazor a dit:
Des sites US listent tout les NDD réservés en temps réel avec des liens vers ces "sites"
En particulier les .com


Sinon, un peu hors sujet (quoique ?), en faisant des recherches je suis tombée sur une page de seroudtable où j'ai découvert un outil (redirige vers http://www.domaintools.com que certains doivent connaître) :
WhoIs.SC - Historical WhoIS information

Très pratique quand on voit toutes les infos qu'on peut avoir sur un ndd :

- "Page information",
- "Indexed Data",
- "Server Data" (avec notamment le "Blacklist status" et "Reverse Ip" pour savoir les autres ndd hébergés sur le serveur),
- "Registry Data"
- et le "Whois Record"
mais aussi une miniature
- les autres extensions de ndd dispos
- surveiller le ndd avec "monitor"
- faire un "backorder" pour devenir propriétaire dès que le ndd est libre...
- et enfin des ndd en vente et aux enchères

Je n'ai pas fait de test avec des sites louches... :lol:

Mais en admettant que GG vérifie tout ça pour un ndd, il y a de quoi moudre...

ps : d'autres sites de ce genre existent sûrement


Sinon un Vieil article (mais hors thème du forum) :
Yahoo aussi vérifie le whois ?
 
Nouveau WRInaute
Plusieurs sites sur la meme IP

Je reviens sur «le coup de la pénalisation des sites sur la meme IP» ; sous certains aspects ça semble «logique», dites-vous. Personnellement, je ne vois pas où est cette logique : quelqu'un pourrait m'en toucher deux mots ?

Bref, en quoi exactement, deux sites partageant la même IP et se faisant des liens réciproques, seraient-ils pénalisés ?

Bien évidemment, je demande ça parce que c'est mon cas : 4 sites sur la même IP se faisant tous des liens réciproques.
 
WRInaute accro
cbmarius>je ne trouve pas logique de "pénaliser" deux sites sur la même IP.

Par contre, pour éviter les abus, je pense que Google prend moins en considération les liens inter-IPs.
 
Nouveau WRInaute
Ok, ça je comprends. Ce que je ne comprenais pas c'était le terme “pénaliser” : au sens d'une amende, un moins en visite ou quelque chose comme ça, et comment un telle pénalisation pouvait s'effectuer.

Par contre je comprends que des liens entre deux sites partageant la même IP soit moins pris en considération (pour le PR par exemple).

Merci pour ces précisions :D.
 
Olivier Duffez (admin)
Membre du personnel

Utilisation des données WHOIS par Google​

Google est accrédité registrar par l'ICANN depuis février 2005, ce qui lui donne accès à de nombreuses informations sur les propriétaires des noms de domaine. Les utilise-t-il ?

ICANN
Déjà l'année dernière, Google avait précisé dans un brevet (Information retrieval based on historical data) qu'il pourrait utiliser des informations issues du WHOIS pour lutter contre le spamdexing (et le phishing) et améliorer la qualité de ses résultats. L'idée principale était d'essayer d'associer une notion de réputation à chaque nom de domaine.

Mais l'ICANN vient de restreindre l'utilisation possible des données du WHOIS afin de protéger les individus et leurs données personnelles :

The purpose of the gTLD Whois service is to provide information sufficient to contact a responsible party for a particular gTLD domain name who can resolve, or reliably pass on data to a party who can resolve, issues related to the configuration of the records associated with the domain name within a DNS nameserver.
On peut se demander si les projets de Google pourront toujours se concrétiser suite à cette décision...

Par ailleurs, Go Daddy vient justement d'obtenir 3 brevets portant sur la notion de réputation associée à un nom de domaine, éventuellement stockée dans le WHOIS.
 
WRInaute occasionnel
Un exemple de pénalisation :

Je gère quatre sites sur la même plage d'IP. Chacun des sites traite d'une industrie très spécifique, mais il arrive que certaines zones des sites traitent d'une même technologie sans que le contenu soit le même puisque les applications et les propriétés étudiées sont différentes). On retrouvera alors parfois les mêmes mots-clés sur lesdites zones.

Il y a relativement peu de sites web abordant ces technologies, et mes sites sont les seuls à les couvrir aussi bien (et des très loin : quand j'ai 15 pages sur le sujet, d'auntres sites ont un court article ou une description de produit....). Pourtant, JAMAIS je n'ai retrouvé deux de mes domaines listés pour une recherche donnée, hormis pour une requête spécifique incluant le nom de ma société (qui est inclue également dans les NDD).

EDIT: évidemment, même plage d'IP, même whois, etc.
 
Olivier Duffez (admin)
Membre du personnel
merci effisk pour ton retour d'expérience. Je ne suis pas persuadé que le problème vienne de là mais j'avoue que c'est troublant.
 
WRInaute occasionnel
WebRankInfo a dit:
merci effisk pour ton retour d'expérience. Je ne suis pas persuadé que le problème vienne de là mais j'avoue que c'est troublant.
Je n'en suis pas (encore) complètement persuadé non plus, car je ne l'observe pas partout (i.e. sur d'autre domaines ayant un même whois).

Une autre petite réflexion dans la même veine :

Nous avons (ma boîte, toujours la même que le premier exemple cité plus haut), lancé un nouveau site il y a quelques semaines. Toujours la même plage d'IP, même whois, etc. cependant le sujet et la structure du nouveau site sont vraiment différents (aucune chance de couvrir les mêmes sujets, et le code n'est pas le même).

J'ai remarqué que le trafic provenant de google des sites préexistants a chuté de manière quasi symétrique à la croissance de trafic issu de google sur le nouveau site (1000 nouvelles visites d'un côté = 1000 visites en moins sur le total du trafic des sites préexistants). Il est encore un peu tôt pour tirer des conclusions, c'est probablement une coïncidence, mais je surveille ça de près. Les capacités de Google ne sont pas exponentielles, cela pourrait être un moyen pour eux de laisser une "fair share" à tout le monde...

Dernière chose, sans rapport direct, plus moyen de commenter sur la page https://www.webrankinfo.com/actualites/2 ... google.htm ?
J'ai laissé deux commentaires qui n'apparaissent pas. Il y a une modération a priori ?

D'ailleurs, la balise titre de cet article est vide, c'est une nouvelle stratégie d'optimisation ? :lol:
 
Nouveau WRInaute
Merci pour l'article et pour toutes ces précisions.

Si je comprends bien, pour «optimiser» il faut prendre un serveur dédidé avec 4 adresses IP et «acheter» les noms de domaine pour dix ans ! Ok.

Une remarqie tout de même. Si Google considère chaque page web comme une entité à part entière — comme il a souvent été dit, ici ou ailleurs — chaque page devrait être, selon cette logique pénalisée : puisqu'elle partage nécessairement avec les autres pages (d'un même site) la même adresse IP.

Selon cette logique (si on la pousse à bout), pour une «optimisation optimale», il faudrait une adresse IP par page ?

Bon, je vous titille un peu :oops:

cb.
 
WRInaute impliqué
j'ai une petite expérience très rigolote à faire :arrow:

un jour en tapant "related:www......" dans google sur un de mes sites
je me suis apercu qu'il me donnait en résultat le nom d'un autre de mes sites,
vous allez me dire et alors ?
et alors ces 2 sites sont reliés par aucune information ou lien ou quoique ce soit hormis le fait que le nom du propriétaire whois est MOI :lol:

donc j'en déduis que google utilise forcément le whois, sinon comment il aurait pu mettre ce résultat ?
faites le test pour vos propres sites.
caro
 
WRInaute occasionnel
J'ai aussi un contre exemple avec un réseau de sites fortements liés tous sur la même IP. Logiquement, ce sont les plus anciens les mieux classés, mais globalement, j'ai de bons résultats.

Un site "père" comporte de nombreux liens vers une trentaine de sites "fils" qui eux même ont un lien vers le site père sur chaque page.

Bref, le principe simple d'une agence web qui fait la promo de ses réalisations qui, elles, comportent tous la signature de l'agence.
 
WRInaute occasionnel
Re:

code a dit:
un changement trop fréquent dans les infos du nichanddle, nicname... est surveillée également. Le dossier indiquait qu'a chaque changement de ces infos, c'est comme si le whois était remis à zero pour google.

et cela pénaliserait le réf du dit site ??? euh... 8O
 
Discussions similaires
Haut