Cet article fait partie des archives de WebRankInfo : certes, il est ancien, mais complet et détaillé pour son époque. Si vous cherchez d'autres informations, faites une recherche sur le site ou participez au forum. Contactez-moi si besoin.
Voici ce que j'ai retenu de l'interview de Priyank Garg par Eric Enge (voir ici en anglais) :
- les liens en pied de page ne sont pas pris en compte pour le positionnement, seulement pour l'indexation.
- sur les 3 dernières années, la part relative des liens (et des anchor text) a diminué dans l'algorithme de Yahoo, en raison de l'intégration de nouveaux critères
- quelques critères utilisés par Yahoo, parmi
plusieurs centaines
:- mise en page des contenus du site
- distribution de la qualité du contenu
- degré de spam du contenu du site
- degré de spam d'une page en particulier
- emphase des mots sur une page
- contexte des textes de liens sur une page
- la lutte contre le spam est effectuée à la fois par l'algorithme et par des humains
- Yahoo n'a a priori rien contre les liens payés : leur algorithme est censé savoir détecter la valeur apportée par un lien aux internautes. Un lien vendu qui apporte une information de qualité au lecteur est pris en compte par Yahoo. Mais encore une fois, on se demande comment un moteur peut vraiment savoir si un lien a été vendu...
- une page avec une balise meta robots noindex ne sortira pas dans les résultats de Yahoo pour aucun des mots présents dans son code source. Néanmoins, dans certains cas particuliers où une telle page reçoit de nombreux liens de très bonne qualité, Yahoo peut l'afficher dans les résultats pour des requêtes portant sur des mots situés dans les textes de ces liens. Dans ces cas, Yahoo n'affiche pas de descriptif, uniquement l'URL. Rappelons également qu'une page avec une balise meta robots noindex transmet des informations par le biais des liens situés sur cette page (elle transmet donc du jus de lien : PageRank, TrustRank et CompagnieRank :-) ).
- sur une page avec une balise meta robots nofollow, les liens ne sont pas utilisés dans l'algorithme de positionnement, mais ils peuvent être exploités par le robot pour découvrir et indexer des nouvelles pages.
- tout comme pour la balise meta robots noindex, une page interdite de crawl dans le fichier robots.txt (et donc a fortiori interdite d'indexation) peut sortir dans les résultats si de nombreux liens de bonne qualité pointent vers elle. Cela arrive dans ce cas pour des requêtes portant sur des mots présents dans les textes de ces liens.
- Yahoo détecte les modèles de pages d'un site et en déduit un certain nombre d'informations. Cela aide par exemple à détecter les liens les plus utiles aux internautes. Rappelons que le webmaster peut aider Yahoo à identifier les zones importantes d'une page, tout simplement en indiquant à l'inverse quelles sont les zones à ignorer (avec la classe CSS robots-nocontent)
On discute aussi de l'algo de Yahoo Search sur le forum Yahoo.
Les 2 principaux crawlers de Yahoo Search
Yahoo Slurp
- Nom : Yahoo! Slurp
- Moteur : Yahoo! Search
- Description : Crawler des pages web de Yahoo! Search
- Nom d'agent (UserAgent) : Mozilla/5.0 (compatible; Yahoo! Slurp; https://help.yahoo.com/kb/search-for-desktop/SLN22600.html?impressions=true)
Yahoo MMCrawler
- Nom : Yahoo-MMCrawler
- Moteur : Yahoo! Search (???)
- Description : Crawler des contenus multimédias pour Yahoo! ? Même intervalle d'adresses IP que l'ancien robot FAST-WebCrawler/3.x Multimedia. Il vient visiter exclusivement le fichier robots.txt et les fichiers multimédia.
- Nom d'agent (User Agent) : Yahoo-MMCrawler/3.x (mms dash mmcrawler dash support at yahoo dash inc dot com)
Si vous avez des questions, posez-les dans le forum WebRankInfo.
Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.
➡️ Offre MyRankingMetrics ⬅️
pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)
Voir les détails ici

Sympa, mais les principales informations nouvelles concernent robot.txt. Sur ce qu'il y a vraiment dans l'algo, on n'en sait pas vraiment plus qu'avant.
Sympa, manque plus que le traffic pour qu'on ai envie de se positionner sur ce moteur.