WRInaute discret
Le Spamdexing provient du mot "spam" et "indexing" (signifiant "indexation" voire "référencement"). L'une des définitions de Wikipedia est tout à fait juste : "référencement abusif destiné aux robots d'indexation de moteur de recherche qui consiste à modifier des pages Web en utilisant des mots-clés d'une façon abusive pour améliorer le classement dans les moteurs de recherche.". Wikipedia nomme un certain nombre de techniques utilisées. J'ai souhaité rendre cette liste de spamdexing plus exhaustive et la rendre plus synthétique pour que chaque webmaster puisse faire son check-up lors de l'optimisation de son site web.
Voici donc une liste plus complète des possibilités de Spamdexing qu'il vaut mieux éviter d'utiliser :
Abus du nombre de mot-clé
Les moteurs de recherche n'apprécient pas une liste trop longue de mots clé, surtout lorsqu'ils sont génériques au site sans aucun rapport avec une page de ce même site. Comptez une vingtaine de mots maximum pour vos Meta Keyword.
Mots clé trompeurs
Ce sont les mots clé qui ne sont pas en adéquation avec le contenu du site. Une pratique courante pour les sites à caractère pornographique.
Répétition de mots clé
Certes il est en général intéressant de répéter certaines occurences sur lesquelles on souhaite ressortir, mais dans une certaine mesure. La densité de mots clé doit être impérativement inférieure à 8-10% du contenu d'une page pour la première occurence.
Empilement de mot-clé
Ce sont les mots clés que l'on retrouve souvent en bas de page sous forme de longue liste, bien souvent suivis de liens Href internes.
Redirections non permanentes
Une redirection non permanente doit être utilisée de manière temporaire. C'est peut être une évidence pour tous, mais combien utilise une redirection de type 302 sans le savoir et finisse par être bannis !
Redirections trompeuses
Ca veut bien dire ce que ça veut dire...
Liens masqués
Liens cachés volontairement pour ne pas être vus de l'internaute tout en étant vus par les robots.
Site miroir
Site identique en contenu et pas forcément en graphisme ou même encore en code source mais générant du contenu similaire (duplicate content). Il faut savoir à ce titre, que les mots clé d'une page ne sont plus réactifs lorsque le moteur de recherche les considère comme du duplicate content.
Texte caché
Texte blanc sur fond blanc par exemple, pour dissimuler à l'internaute l'existence de ce texte tout en étant vu par les robots.
Texte minuscule
Idem que le texte caché, mais dans ce cas, on dissimule le texte en l'écrivant en tout petit, de manière à ce que l'internaute ne puisse pas le lire.
Ferme de liens (linking farm)
Application de méthodes visant à augmenter artificiellement le nombre de liens vers une page. Par exemple, un site hébergeant des listes de liens vers tous les autres sites qu'on contrôle pour améliorer le classement de ces derniers en les faisant apparaître populaires.
Pages permutée (cloaking)
Technique qui permet pour une même page web, de proposer plusieurs versions selon l'utilisateur. Bien souvent une pour l'internaute et une autre destinée aux robots. Attention les robots arrivent désormais à changer d'IP pour se faire passer pour un internaute.
Pages répétées
Un peu comme le site miroir, mais dans ce cas, il s'agit d'une page que l'on répète en changeant très peu d'éléments et en laissant apparaître une liste de mots clé génériques. Comme toutes ces pages ont un contenu similaire, les moteurs de recherche risquent de les considérer comme du duplicate content et finissent par les désindexer simultanément.
Pages satellites (doorway)
Page web satellite qui propose un empilement de mots clé en liens pour augmenter la popularité du site et pour être réactif sur certaines occurences. Par exemple,grâce au Javascript, ces pages sont redirigées vers le site principale, sans que l'internaute puisse le voir. Quant aux robots, ils s'arrêtent eux, sur cette page technique bourrée de mots clé sans voir la redirection en Javascript.
Baragouinage
Phrases non construites, n'utilisant q'une suite de mots clé. Attention les robots arrivent de plus en plus à déceler ce genre de page, notamment dans les balises Meta Description et Title. Par exemple, si la phrase contient énormément de virgules, tirets, parenthèses, etc.
Domain Spam
Noms de domaine à rallonge utilisant une succession de mots clé ou URL rewritée avec trop de mots ou proposant une répétition inutile d'occurence
Typo Spam
Déclinaison sous plusieurs formes typographique des mêmes mots clé. Par exemple, mettre la même série d'occurence en italique, gras, souligné, majuscule, minuscule, etc. En théorie ceci améliore grandement la réactivité de cette occurence
Cybersquatting
Utilisation de nom de domaine proche ou décliné de ceux de grands sites pour les rediriger vers un site à contenu différent. Voire identique : évitez d'utiliser des dizaines de noms de domaine (contenant les mots clé qui vous intéressent) qui pointent vers votre site principale, même avec une redirection permanente.
J'espere que cette documentation vous sera utile.
Bonne journee sur WRI
Voici donc une liste plus complète des possibilités de Spamdexing qu'il vaut mieux éviter d'utiliser :
Abus du nombre de mot-clé
Les moteurs de recherche n'apprécient pas une liste trop longue de mots clé, surtout lorsqu'ils sont génériques au site sans aucun rapport avec une page de ce même site. Comptez une vingtaine de mots maximum pour vos Meta Keyword.
Mots clé trompeurs
Ce sont les mots clé qui ne sont pas en adéquation avec le contenu du site. Une pratique courante pour les sites à caractère pornographique.
Répétition de mots clé
Certes il est en général intéressant de répéter certaines occurences sur lesquelles on souhaite ressortir, mais dans une certaine mesure. La densité de mots clé doit être impérativement inférieure à 8-10% du contenu d'une page pour la première occurence.
Empilement de mot-clé
Ce sont les mots clés que l'on retrouve souvent en bas de page sous forme de longue liste, bien souvent suivis de liens Href internes.
Redirections non permanentes
Une redirection non permanente doit être utilisée de manière temporaire. C'est peut être une évidence pour tous, mais combien utilise une redirection de type 302 sans le savoir et finisse par être bannis !
Redirections trompeuses
Ca veut bien dire ce que ça veut dire...
Liens masqués
Liens cachés volontairement pour ne pas être vus de l'internaute tout en étant vus par les robots.
Site miroir
Site identique en contenu et pas forcément en graphisme ou même encore en code source mais générant du contenu similaire (duplicate content). Il faut savoir à ce titre, que les mots clé d'une page ne sont plus réactifs lorsque le moteur de recherche les considère comme du duplicate content.
Texte caché
Texte blanc sur fond blanc par exemple, pour dissimuler à l'internaute l'existence de ce texte tout en étant vu par les robots.
Texte minuscule
Idem que le texte caché, mais dans ce cas, on dissimule le texte en l'écrivant en tout petit, de manière à ce que l'internaute ne puisse pas le lire.
Ferme de liens (linking farm)
Application de méthodes visant à augmenter artificiellement le nombre de liens vers une page. Par exemple, un site hébergeant des listes de liens vers tous les autres sites qu'on contrôle pour améliorer le classement de ces derniers en les faisant apparaître populaires.
Pages permutée (cloaking)
Technique qui permet pour une même page web, de proposer plusieurs versions selon l'utilisateur. Bien souvent une pour l'internaute et une autre destinée aux robots. Attention les robots arrivent désormais à changer d'IP pour se faire passer pour un internaute.
Pages répétées
Un peu comme le site miroir, mais dans ce cas, il s'agit d'une page que l'on répète en changeant très peu d'éléments et en laissant apparaître une liste de mots clé génériques. Comme toutes ces pages ont un contenu similaire, les moteurs de recherche risquent de les considérer comme du duplicate content et finissent par les désindexer simultanément.
Pages satellites (doorway)
Page web satellite qui propose un empilement de mots clé en liens pour augmenter la popularité du site et pour être réactif sur certaines occurences. Par exemple,grâce au Javascript, ces pages sont redirigées vers le site principale, sans que l'internaute puisse le voir. Quant aux robots, ils s'arrêtent eux, sur cette page technique bourrée de mots clé sans voir la redirection en Javascript.
Baragouinage
Phrases non construites, n'utilisant q'une suite de mots clé. Attention les robots arrivent de plus en plus à déceler ce genre de page, notamment dans les balises Meta Description et Title. Par exemple, si la phrase contient énormément de virgules, tirets, parenthèses, etc.
Domain Spam
Noms de domaine à rallonge utilisant une succession de mots clé ou URL rewritée avec trop de mots ou proposant une répétition inutile d'occurence
Typo Spam
Déclinaison sous plusieurs formes typographique des mêmes mots clé. Par exemple, mettre la même série d'occurence en italique, gras, souligné, majuscule, minuscule, etc. En théorie ceci améliore grandement la réactivité de cette occurence
Cybersquatting
Utilisation de nom de domaine proche ou décliné de ceux de grands sites pour les rediriger vers un site à contenu différent. Voire identique : évitez d'utiliser des dizaines de noms de domaine (contenant les mots clé qui vous intéressent) qui pointent vers votre site principale, même avec une redirection permanente.
J'espere que cette documentation vous sera utile.
Bonne journee sur WRI