J'ai refait le test tiret et underscore

  • Auteur de la discussion Auteur de la discussion pipologue
  • Date de début Date de début
WRInaute occasionnel
Olivier avait fait le test en 2004.

https://www.webrankinfo.com/actualites/2 ... rscore.htm

Le résultat est strictement le même, sur un nouveau test indentique mené entre mai et juin 2006. Le tiret est toujours un séparateur entre les mots du nom d'une page et l'underscore non.

Ca ne dit toujours pas dans quelle mesure les mots sont pris en compte. J'ai mis l'étude complète et détaillée au format PDF sur mon blog pour ceux que ça intéressent d'avoir les résultats complets sur de nombreuses combinaisons de mots.

-http://www.pipologue.com/index.php/2006/06/09/131-tiret-ou-underscore-le-test

Et en passant, petite excuse à Olivier de n'avoir pas fait le test avant de me poser des questions sur le forum quant à la validité de son étude de 2004 (ça ne fait pas de mal et j'arrête d'être ridicule).
 
WRInaute impliqué
touttoulon a dit:
à quand le test : une vigurle est-elle mieux qu'un tiret ?
(sur google, yahoo et ... msn ;))

on attend que tu t'en occupes touttoulon...

il y avais un topic dédié a ce débat foireux...

mais de toute facon, je suis persuadé que le tiret et la virgule sont identiques pour tous les moteurs, sauf pour msn qui n'aimes pas trop trop les tirets
 
WRInaute occasionnel
Foireux dit'il, je ne crois pas qu'il le soit...

Au fond l'url rewriting ça sert à quoi? transformer des url de page dynamique blindées de variables en url sans variable apparente...

Mais l'url rewriting prend toute sa valeur quand on arrive à recréer la structure d'un site non dynamique (full html)...

Est-ce naturel de mettre une virgule dans un nom de fichier ?... Non...

Google finira par péter un gros filtre pour dégager toutes ces urls motclé'isées qui contiennent des virgules...

Si je me trompe que j'aille en sandbox ;)
 
WRInaute occasionnel
J'ai lancé un nouveau test avec 7 séparateurs différents, je posterai le résultat sur mon blog + un test sur le nombre de séparateurs...
 
WRInaute passionné
touttoulon a dit:
Est-ce naturel de mettre une virgule dans un nom de fichier ?... Non...

Est-ce naturel de faire caca assis ?... Oui...

touttoulon a dit:
Google finira par péter un gros filtre pour dégager toutes ces urls motclé'isées qui contiennent des virgules...

Je vois pas le rapport entre liste de mots clés dans l'url et les virgules. On peut très bien faire une liste de mots clés avec des + ou des | ou encore des ;
 
WRInaute occasionnel
rottman, reviens au bases de l'informatique.

quand tu enregistres un document .txt, tu colle des , des + des | ou des ; dans le nom du document ????

url rewriter = ce n'est pas que faire disparaitre des variables, c'est aussi faire croire à google le plus possible que le fichier existe en dur... plus tu t'éloignes du schéma classique plus tu es repérable...
 
WRInaute passionné
touttoulon a dit:
quand tu enregistres un document .txt, tu colle des , des + des | ou des ; dans le nom du document ????

MOI, non. mais des gens qui n'y connaissent strictement rien en web, utilisent souvent des virgules, est-ce pour ça qu'on doit les pénaliser ?

rottman> non, pas avec des | car c'est un caractère unsafe. le ; est quant à lui reserved.

Le document de référence sur les URL : http://www.ietf.org/rfc/rfc1738.txt

Il s'agit de "regles". Les ptit webmasters du dimanche de perso.wanadoo connaissent t-il tous ces regles ?
 
WRInaute accro
Les gens qui n'y connaissent strictement rien en Web agissent de manière instinctive, naturelle, et les logiciels le leur permettent : ils séparent les mots par des espaces.

Lettre pour dire à belle-maman que pour Noël on veut pas la voir.doc

Tout le reste, ce sont des astuces.
On utilise les astuces parce que les moteurs sont peu compétents et ont chacun leurs sales petites manies.
Savoir quel moteur préfère le + ou le gnagni ou le gnagna, c'est les conforter dans leur médiocrité.

Ecrivons de manière naturelle.

Les moteurs n'ont qu'à se mettre à niveau.
 
WRInaute accro
Touttoulon a dit:
Szarah -> crées ton "web .Szarah" :)
Je ne suis pas la seule à ne pas se laisser emmieller par des machines, j'ai toujours dit ce que je voulais à qui de droit, on est nombreux et tu serais surpris de savoir les effets que ça peut produire.
Tu crois qu'ils l'ont sucée de leur pouce, l'Accessibilité de IE4 ? Le respect des couleurs-système de Adobe Reader 6 ?
Si tu ne dis pas ce que tu veux, ils font comme ils l'entendent, et c'est généralement médiocre.
D'autres sont plus radicaux, au lieu de vouloir modifier l'existant, ils veulent créer du neuf - pas mon truc.
 
WRInaute occasionnel
tu vas quand même pas réformer toute l'histoire de l'informatique :)

le nom du fichier "Lettre pour dire à belle-maman que pour Noël on veut pas la voir.doc" n'est pas dans un format standard, et ne l'a jamais été...
 
WRInaute accro
Touttoulon a dit:
tu vas quand même pas réformer toute l'histoire de l'informatique
Il y a ceux qui font l'Histoire et ceux qui la subissent :)
Moi, il y a longtemps que j'ai choisi ...

le nom du fichier "Lettre pour dire à belle-maman que pour Noël on veut pas la voir.doc" n'est pas dans un format standard, et ne l'a jamais été...
Mais cela viendra :)
 
WRInaute occasionnel
Szarah, t'as mangé des Frosties ce matin ? :D
tony_frosties_flakes.jpg
 
WRInaute passionné
touttoulon a dit:
tu vas quand même pas réformer toute l'histoire de l'informatique :)

le nom du fichier "Lettre pour dire à belle-maman que pour Noël on veut pas la voir.doc" n'est pas dans un format standard, et ne l'a jamais été...

ok ok les "standards", et si google prenait ton site pour du spam car, n'étant pas valid XHTML, et hop dans un filtre :D
 
WRInaute impliqué
à propos du RFC sur les URL
Il s'agit de "regles". Les ptit webmasters du dimanche de perso.wanadoo connaissent t-il tous ces regles ?

Certes non mais ils peuvent aussi faire des sites sous Frontpage, des menus en Applet java et j'en passe.
On parle entre personnes qui essayent de faire les choses dans les règles de l'art, non ? Enfin à peu près.
Disons qu'en respectant les RFC, on s'évite probablement des surprises un jour.

Sinon, le test - et _ est un grand classique, mais verra t'on un jour le test du - _ %20 , + ?
Je ne sais pas comment faire ces tests et ça ne m'intéresse pas plus que ça, du reste, mais ça permettrait peut-être de tuer les mythes, d'éviter les bugs.

plaqntbltmit.gif
 
WRInaute impliqué
je voudrais pas foutre la merde... mais wikipedia accepte les nom de pages avec des espaces, qui sont donc remplacés par des %20 et cie... non?

Et je crois meme que google affiche l'url sans les %20 dans ses pages de résultats parfois ^^

Ceci dit, c'est une vrai connerie de microsoft que d'avoir autorisés les espaces dans un nom de fichier, c'est meme scandaleux... pour moi l'informatique, c'est unix, c'est pas crosoft ( a propos, microsoft va reprendre le principe d'une base unix pour vista, avec un system de noyau etc... on en reviens toujours aux sources)

Donc bref, pour moi un nom de fichier ne comporte pas d'espace!
 
WRInaute discret
Merci pr le test Tiret underscore, il sera interessant pour beaucoup de nous.. ;)

Ce qui serait interessant c'est de savoir si les virgules ont le même poind effectivemet que les tirets, ainsi que d'autres separateurs "|;.".. vu qu'aucun test dans ce sens n'a été fait en ma connaissence.
 
WRInaute accro
Oh bin pour moi, un nom de fichier c'est 8.3 point barre, et seulement a-z sans majuscule et 0-1.
Zim' a dit:
a propos, microsoft va reprendre le principe d'une base unix pour vista, avec un system de noyau etc... on en reviens toujours aux sources
Vivi, Vista sera le premier .nix à cartonner pour de vrai dans le très très grand public, et les détracteurs de MS, voyant ce linux-like, n'ont qu'à bien se tenir :)
 
WRInaute discret
Est-ce naturel de mettre une virgule dans un nom de fichier ?... Non...

Entre le naturel et les moeurs, il y a un grand fossé.
Je suis d'avis que tous ce qui passe, a une raison de passer.
Une virgule c'est caractère comme un autre.
(Au passage, beaucoup de sites dont les webmasters n'ont pas l'air hyper méga calé en prog et qui utilise des virgules, passent trés bien GG, alors pourquoi pas la virgule...) :roll:
Peut être google aime aussi qu'un site ne soit pas parfait, ce qui peut rendre plus crédible quand au contenu du site.

:)
 
WRInaute discret
Je suis pleinement d'accord avec Szarah.
J'irai même plus loin, il est inadmissible que les système *nix ne permettent pas l'utilisation de caractères non alphanumériques (comme les caractères accentués ou les idéogrammes) dans les noms de fichier.
Depuis que j'ai passé le serveur sous Linux je suis emmerdé à cause de ça.
J'ai un dossier par auteur et chacun de ces dossiers contient des dossiers au nom des histoires.
Tous les caractères accentués sont remplacés par des underscores.
Imaginez un japonais qui veux publier une histoire, tout le nom du dossier ne serait composé que d'underscores !
Il n'y a que Windows qui traite ces fichiers/dossiers correctement.
J'en suis arrivé au point où je me demande sérieusement si je ne vais pas repasser le serveur sous Windows :evil:
 
Nouveau WRInaute
Ok, si le mot clef est uniquement dans l'url, une séparation avec un underscore le fait pas ressortir...

Par contre, si le mot est dans la page et dans l'url, Google le met bien en gras dans l'url des résultats:

La fête de la moisson à Provins par exemple
https://www.google.fr/search?hl=fr&q=moi ... %3Dlang_fr

Je ne sait pas si aujourd'hui il s'en sert, mais il y a quelques mois, Google ne faisait pas apparaitre le mot clef en gras dans l'url quand il etait séparé par un underscore....
 
Nouveau WRInaute
nouvel exemple :
-sur google, faites:
privas rhone vallees conseils
-cochez pages france et envoyez
-regardez la première URL
-3 mots en gras
-maintenant enlevez
rhone
-vérifiez
-remettez
rhone
-et enlevez
vallees
-vérifiez
 
WRInaute occasionnel
Que Google mettre un mot en gras est une chose... qu'il reconnaisse le mot et s'en serve pour le référencement et définir le contenu de la page est tout autre chose...
 
Nouveau WRInaute
en complément, on peut regarder comment google gère les mots d'une recherche.
à partir de cette page:

https://www.google.fr/search?hl=fr&q=tra ... cher&meta=

on peut constater que :
si on met "ardeche" alors google va trouver ARDECHE, ardèche, Ardèche, ... etc dans le corps de la page et trouvera "ardeche" dans l'URL avec ou sans underscore.
il trouve toutes les occurrences dont le soundex est identique dans le corps de la page sauf dans l'URL ou il se contente de mettre le mot de recherche en minuscule.
si on met "ardèche" alors google trouve toutes les occurrences dans le corps de la page mais ne trouve pas "ardeche" dans l'URL.

de meme, avec les parametres d'une URL, google les trouve pourvu qu'ils soient précédés d'un espace "%20".
si vous faites peécéder tous vos parametres de "%20" alors google les indexera tous.
 
Nouveau WRInaute
Bon ben moi en lisant rapidement la première page hier j'ai décidé de changer 3 pages et de les renommer en changeant les underscore par le tiret, puis ensuite j'ai effectivement fait un test et dans l'url les mots entre underscore sont bien mis en gras ...
Mais est-ce qu'il y aura une différence ? On verra peut être après la GD, la j'ai les deux pages qui coexistent ... :?:
 
Nouveau WRInaute
pipologue,
je ne vois pas l'intérêt de reconnaître un mot si c'est pour ne pas se servir du résultat.à moins que les mecs de google codent uniquement pour le plaisir....
reste à savoir quel est le poids d'un mot de l'URL dans leur algo...attendons la fin des tests mais là encore, je ne vois pas pourquoi, à partir du moment ou ils ont localisé le mot, ils feraient la différence entre un mot qui a été précédé d'un tiret et un autre qui a été précédé d'un underscore => c'est une démarche qui me semble illogique.
 
WRInaute accro
sylphe07 a dit:
je ne vois pas l'intérêt de reconnaître un mot si c'est pour ne pas se servir du résultat.à moins que les mecs de google codent uniquement pour le plaisir....
il ne les reconnait pas, il se contente de colorer bêtement toutes les occurences de ce mots même lorsque ce mot est inclut dans un autre (ex si tu cherche battre, et que le mot rabattre apparait sur la page de résultats il le colorera comme ça : rabattre, ce qui ne veux bien entendu rien dire ... et si tu recherche "a" voila comment il colorera taratata ... :lol:


PS : tu penses bien que Google va pas te dire pourquoi il a fait sortir une page dans les résultats ... :wink:
 
WRInaute accro
Cendrillon a dit:
PS : tu penses bien que Google va pas te dire pourquoi il a fait sortir une page dans les résultats ... :)
Ah la la ... Que d'espoirs déçus avant même d'avoir été clairement formulés :)
 
WRInaute occasionnel
Merci Cendrillon... Si Google colorie les mots, c'est sans doute pour les faire ressortir.

Il y a donc une utilité à ce que le mot se retrouve plusieurs fois dans l'URL, description et titre, pour se faire remarquer dans la liste des résultats. Probablement que les yeux repèrent mieux la concentration d'éléments mis en gras...
 
Nouveau WRInaute
pipologue a dit:
Olivier avait fait le test en 2004.

https://www.webrankinfo.com/actualites/2 ... rscore.htm

Le résultat est strictement le même, sur un nouveau test indentique mené entre mai et juin 2006. Le tiret est toujours un séparateur entre les mots du nom d'une page et l'underscore non.

Ca ne dit toujours pas dans quelle mesure les mots sont pris en compte. J'ai mis l'étude complète et détaillée au format PDF sur mon blog pour ceux que ça intéressent d'avoir les résultats complets sur de nombreuses combinaisons de mots.

-http://www.pipologue.com/index.php/2006/06/09/131-tiret-ou-underscore-le-test

.

Un truc qui me chagrine tout de même: pourquoi tes pages de test ne sont-elles plus en ligne pour que l'on puisse constater tes résultats de visu ?

Par exemple https://www.google.com/search?q=Kebalact ... unofficial
donne 0 réponses !
 
WRInaute impliqué
Mais d'où vient l'obstination de Google à refuser les _ comme séparateur dans l'URL, quel est l'intérêt profond?

tool,pondit,schism
Maynard_ruina_APC

Maintenant faudrait chercher sur cette page ;)
 
WRInaute discret
cprail a dit:
Mais d'où vient l'obstination de Google à refuser les _ comme séparateur dans l'URL, quel est l'intérêt profond?

tool,pondit,schism
Maynard_ruina_APC

Maintenant faudrait chercher sur cette page ;)

Je suis toujours étonné de lire sur WRI ou ailleurs que l'usage de l'underscore est déconseillé dans l'URL.

J'ai travaillé en Janvier 2006 sur la promotion d'un site, dont les mots-clés contenus dans l'URL étaient - et sont toujours - séparés par un underscore.

Le positionnement qui en résulte est tout à fait satisfaisant, voir même un succès.

Alors soit j'ai pas bien compris la notion de séparateur, soit Google et ses amis m'ont fait une fleur
 
WRInaute accro
soit google tient de moins en moins compte des mots présents dans l'URL (ce qui semble le plus logique, étant donné que tout le monde suroptimise ses URL aujourd'hui)
 
WRInaute discret
Oui e-kiwi, c'est une autre possibilité.

Cependant, quand Google affiche des résultats de recherche par rapport à des mots-clés tapés, nous savons tous qu'il met en gras dans ses résultats les mots-clés correspondants.

Dans le cas que j'ai évoqué, Google affiche bien en gras dans l'URL (affichée en couleur verte) les mot-clés correspondant à la requête saisie, bien qu'ils soient séparés par un underscore...

Enfin bref...

Je ne pense pas que le fait de donner des noms cohérents à ses répertoires et fichiers soient de la suroptimisation, sauf bien sur quand le nom du fichier ou du répertoire est composé d'une chaine de mots-clés.

Par exemple, il me semble naturel qu'un site qui a pour thème les chats ait ce genre de structure :

-http://www.*****.fr/chat-domestique/chat-angora.fr

Appelons un chat un chat !
 
WRInaute discret
Merci, cet article m'avait en effet échappé.

Il date du 3 avril (aujourd'hui), ne me dites pas que vous avez écrit cet article dans les 5 minutes qui ont suivi mon post !
 
Olivier Duffez (admin)
Membre du personnel
non pas 5 minutes, ton 1er post "datait" de 8h41...
J'espère en tout cas qu'il répond à tes questions
 
WRInaute impliqué
Je ne crois pas que les url comptent beaucoup dans le calcul mais bon... quelqu'un qui commence un nouveau site gagne probablement à optimiser les url... sinon bien c'est esthétique comme intérêt ;)
 
Discussions similaires
Haut