Le 11 Mars 2004, 2 chercheurs (Zoltan Gyongyi et Hector Garcia-Molina) de l'université de Standford (Etats-Unis), celle-là même d'où sont issus les co-fondateurs de Google, Larry Page et Sergey Brin, écrivent avec Jan Pedersen, un chercheur de Yahoo! (un concurrent de Google) un article intitulé Combating Web Spam with TrustRank. Cet article décrit un algorithme qui a pour objectif de réduire le spam dans les moteurs de recherche, c'est-à-dire d'améliorer la pertinence des résultats.
L'algorithme du TrustRank propose une méthode semi-automatique de classification des pages web (spam ou pas spam). Il est basé sur une liste de pages de référence garanties "propres" après une analyse manuelle faite par un humain. Par propagation et analyse des liens entre pages, l'algorithme détermine si les autres pages sont également "propres" ou si au contraire elles sont du spam, en partant du principe que les pages "propres" font très rarement des liens vers des pages de spam.
L'algorithme nécessite une très bonne sélection des sites de référence (une simple liste de 200 sites a donné de bons résultats d'après l'article). Au final, il attribue une note à chaque page, son TrustRank (TR). Comprise entre 0 (spam) et 1 (page de référence), elle indique le degré de confiance que l'on peut attribuer à la page.
Le TrustRank peut être utilisé seul pour filtrer l'index d'un moteur de recherche, ou en complément du PageRank pour aider à classer les résultats d'une recherche.
Google utilise peut-être déjà un algorithme approchant depuis des mois... ou bien prévoit de le faire bientôt. Difficile d'être catégorique dans ce domaine.
Discutez de l'article Description du TrustRank de Google dans le forum
Si vous avez des questions, posez-les dans le forum WebRankInfo.
Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.
Le trust Rank est à mon avis de plus en plus important sans parler de la balise canonique car sur internet tout le monde se sert chez le voisin et pourtant c'est sanctionné par google!
La balise canonique aurait un effet si les copieurs la mettaient, ce qu'ils ne font pas évidemment.
Cette remarque sur la balise canonique n'est donc pas appropriée il me semble...