Nouvelle technique spamdexing : le retour des frames

WRInaute discret
Je viens de m'apercevoir qu'un gros site (dans le top 50 de Médiametrie)avait remis au gout du jour, après les div cachés qui sont maintenant "vues" par Google, la vieille technique de la frame avec les valeurs 0,* . But de la manoeuvre :

- obtenir des URLS interessantes pour le référencement. a priori ils ne maitrisent pas l'URL rewriting et puis ce n'est pas assez souple car il s'agit de...

- ... bourrer la frame d'un immonde charrabia contenant x occurences de x mots-clés

- faire des liens vers d'autres frames bidon
 
WRInaute accro
En gros, il mets une frame invisible, et dans la page appellée par la frame, il mets ses mots clés ?

Donc, en gros, il a :
- page 1, avec du contenu normal, et qui inclue une frame
- page 2, avec uniquement des mots clés, et qui est inclue dans la frame de page 1

C'est bien cela ?
Dans ce cas la, tu a deux pages. la page 1 ne contient pas les mots clés. Seule la page 2 les contient, la supercherie sera détectée très rapidement.
Mais surtout, ca n'a aucun intéret puisque les mots clés ne sont pas pris en compte dans la page.
 
WRInaute impliqué
kazhar a dit:
Mais surtout, ca n'a aucun intéret puisque les mots clés ne sont pas pris en compte dans la page.

Pas si la frame appelée seule par un visiteur humain redirige sur la page principale, ou l'inclut côté serveur. Mais là c'est du cloaking assez classique.
 
WRInaute occasionnel
:lol: j'ai un concurrent qui fait ca depuis un an
je lui ai fais un mail pour lui expliquer qu'il était complètement taré, et qu'il allait se faire blacklister

Il m'a répondu, on en a déjà discuté avec google, on fait de l'accessibilité :lol:
Laisse courrir.. que veux tu..
c'est pas pire que les annus qui génèrent des millions de pages
 
WRInaute discret
Eclaircissements sur la technique

Pour ceux qui désire en savoir un peu plus sur la technique utilisée sur laquelle je n'ai pas été très clair :

- sur un total de 267 000 page indexées dans Google, il existe 55 frames concernant les 55 sujets phares en rapport avec le thème du site.

- les frameset contiennent les frames dispatchées "100%,*". Le 100% est évidemment ce que voit l'internaute. Le * lui n'appel rien du tout !!

- c'est dans le frameset que ce situe le spamdexing avec la balise <noframe> donc un truc hyper classique ! : le texte contient des classiques balises <h1> <p> et beaucoup de <b> sur les mots clés qui les interessent avec aussi des listes <ul> pour les liens vers les autres frameset.

- Le texte pourrait vouloir dire quelque chose (il semble que ce soit des copier coller de différents morceaux de texte sur différentes pages du site) mais il est "truffé" par la ou les expressions clés qui reviennent en moyenne 20 fois chaque. Les expressions clés sont toujours en gras.

J'ai fait un rapide calcul : pour une page visible utilisateur contenant 420 mots (y compris la navigation et les pubs soit environ 150 mots), le frameset en contient le double (sans nav et sans pub mais avec les liens vers les autres frames à l'URL "qui va bien").

Ca n'a rien donc de rien de révolutionnaire mais ce qui est interessant c'est que le site a abandonné les div cachés qui truffaient ses pages pour cette technique. D'autres référenceurs font-il la même chose en ce moment ?
 
WRInaute impliqué
Ah mais c'est différent, la balise <noframe> est tout à fait valide et tolérée pour le référencement. Par rapport à un div caché qui est objectivement une tentative de détourner des mots-clés, pour détecter une manipulation dans une balise <noframe>, il faut un évaluateur humain bien formé.
Pour ce qui me concerne je la déplore, mais à mon avis c'est une "excellente" technique de keyword stuffing.
El Bono a dit:
D'autres référenceurs font-il la même chose en ce moment ?
Oui, on observe ça assez souvent.
 
WRInaute accro
Tilt a dit:
Ah mais c'est différent, la balise <noframe> est tout à fait valide et tolérée pour le référencement. Par rapport à un div caché qui est objectivement une tentative de détourner des mots-clés, pour détecter une manipulation dans une balise <noframe>, il faut un évaluateur humain bien formé.
Pour les div cachées aussi;
D'une manière algorithmique, ça doit être beaucoup plus facile de détecter le spam dans des noframe que dans des div cachées pour lesquelles il faut aller voir au fin fond des feuilles de styles. D'autant plus que pour beaucoup de besoins de présentation on utilise des div cachées que l'on fait apparaitre quand besoin est.
 
WRInaute impliqué
Oui en effet, encore qu'on observe encore une majorité de <div style="visibility:hidden"> ou dans ce genre sur les pages...
J'ai vu l'autre jour un truc assez imparable sans évaluation humaine: une application de style par javascript et cryptée (genre "document.write('<style>'+un truc en rot13 pour enlever la visibilite d'une classe+...)"
Ca me fait quand même doucement sourire.
 
WRInaute accro
j'ai aussi vu, récemment j'en avais parlé sur WRI de la redirection de pages satellites sous la forme
Code:
document.write('loca'+'tion:'+'http'+...
au lieu de mettre leurs forces pour faire ça, ils feraient mieux de faire de bons sites référençables !
 
WRInaute impliqué
Complètement d'accord.
Je ne vois pas l'intérêt, sauf à vouloir se faire une super carte de visite:
" Roger Bredouille,
Artisan Spammeur,
Mastere (Pré-)Histoire de l'Internet, option Cloaking du CEG de Pas-en-Artois
Déplacements à domicile"
 
WRInaute discret
Et si c'est pas du spamdexing, c'est quoi !

Tilt, l'utilisation de la balise noframe pour écrire un immonde charrabia qui ne veut rien dire, qui est censé donné plus de pertinence à une page qui a priori n'en a pas plus qu'une autre qui ne "triche" pas et qui présente un contenu différent à l'internaute de ce que voit le moteur, c'est bien la définition même du spamdexing, non ?

Ce que je trouve étrange, c'est la réutilisation de noframe alors même que j'ai lu ici ou là que ces balises n'allaient plus rentrer dans l'index de GG et ce dans un avenir assez proche...
 
WRInaute accro
Oui, mais d'ici là, le client aura eu son site et payé :lol: :lol:
Si ne pouvaient se prénommer "web-agency" que les entreprises sachant faire des sites où va-t-on alors :twisted:
 
Discussions similaires
Haut