Google reconnait les différentes formes des mots

  • Auteur de la discussion Auteur de la discussion dh
  • Date de début Date de début
WRInaute occasionnel
de plus en plus élaboré, il amalgame verbes conjugés ou participés, les singulier/pluriel, mais il différencie selon les accents !
 
WRInaute occasionnel
J'en conclu que l'algo va tenir compte de ces variations et probablement penaliser encore plus la suroptimisation sur les mots clefs repétés sans variations!

dh
 
Olivier Duffez (admin)
Membre du personnel
j'ai tenté de résumer certaines idées dans un article...

Google identifie les formes des mots (singulier/pluriel notamment)​

Depuis longtemps, pour Google, les mots "patinoire" et "patinoires" sont différents, si bien que si on veut être positionné sur les 2 formes, il faut prévoir les 2 cas (par exemple créer 2 pages). Il est possible que ceci soit en train de changer, voici donc quelques pistes de réflexion.

En anglais, Google sait assez bien reconnaître la relation entre des mots "sémantiquement proches" (*), même s'ils n'ont pas la même racine. En utilisant l'opérateur tilde devant un mot, Google peut fournir des résultats ne portant pas uniquement sur les mots de la requête, mais aussi sur des mots associés. Il semble que ce soit le cas maintenant en français (peut-être ai-je des mois de retard et que le support du français date déjà...).

Une recherche de ~musique montre que Google sait que le mot "chanson" est "sémantiquement proche" du mot "musique".
Résultats de la recherche ~musique


Edit : attention, depuis, Google a supprimé son opérateur ~ de recherche spéciale...

Mais attention ! Il faut bien distinguer la phase d'analyse de la pertinence des pages web pour une requête donnée (application de l'algorithme de Google) de celle de l'affichage des résultats. La mise en gras de certains mots dans l'affichage des résultats n'indique pas (forcément) que le même processus a été utilisé lors de la première phase.

Aujourd'hui, d'après l'affichage des résultats dans Google, il est indéniable que Google sait reconnaître (en français) :

  • le singulier et le pluriel
  • d'autres formes du même mot
  • d'autres mots "sémantiquement proches"
Toutes les formes ne sont pas encore reconnues. Je vous invite à en discuter dans le forum (voir les liens en fin d'article).

Exemple avec la recherche petit pain au chocolat qui affiche en gras le mot "pains" au pluriel :
Résultats de la recherche petit pain au chocolat


Exemple avec la recherche installer une patinoire qui affiche en gras le mot "installation" en plus du mot "installer" :
Résultats de la recherche installer une patinoire


En conclusion, il reste à faire des tests pour savoir si cette prise en compte des différentes formes des mots (ou mots proches) est faite uniquement à l'affichage ou bien aussi dans l'algorithme de Google. Si cette deuxième hypothèse se révélait vérifiée, il faudrait certainement revoir sa façon d'optimiser ses pages (même si conseiller d'utiliser différentes variations de mots n'est pas nouveau...). Ceux qui en sont restés au stade de la répétition dans une page de la même forme d'un mot vont devoir changer leurs habitudes.

(*) J'utilise l'expression "sémantiquement proche" entre guillemets car je ne sais pas comment la définir autrement. Les spécialistes de linguistique me corrigeront sans doute...
 
Nouveau WRInaute
Cela reste étrange, peu cohérent :
j'ai cherché nombre flottant, il ne met pas en valeur les pluriels, mais il met en gras flottant dans le mot flottante :
jpb.forth.free.fr/Francais/pages_techniques/virgule_flottante.html

Ce qui dénote aussi qu'il cherche dans les parties d'URL.

Note : si la technique est récente, il est possible / probable que Google n'ait pas réindexé les 8 milliards de pages qu'il a dans sa base de données...

Par contre, l'URL ci-dessus disparaît si je fait la recherche :
inurl:flottant nombre

Va comprendre quelque chose aux algos de Google !
 
WRInaute accro
Visiblement c'est de plus en plus fréquent ces mots associés,
cet après midi, je fais une recherche poupon, et j'ai trouvé des poupées. Plus fort encore en cherchant "big smileys", je m'attendais à trouver des "big smiley", mais en voyant "big smilies" ça m'a vraiment surpris.
Cette nouvelle façon de faire des "renvois" va changer forcément la fréquentation de nos sites puisque des mots clés jusque là inactifs, ou peu utilisés vont pouvoir devenir actif (puisque synonyme).
 
Discussions similaires
Haut