Nouveau WRInaute
Après analyse en profondeur d'un site, j'ai remarqué que d'anciens URL Rewritings foireux (espaces, caractères accentués, etc), corrigés depuis, étaient toujours présents dans les résultats de Google.
Jusque là, pas trop grave, sauf que si on a une URL du genre :
page-1-bête erreur-2.html (qui renvoie sur page.php?num=$1&nom=$2&type=$3)
Dans les résultats de Google, on voit un truc du genre
page-1-b%E7te%20erreur-2.html
qui devient page-1-%C8E7te%C820erreur-2.html
ensuite page-1-%B3C8E7....
et ainsi de suite, jusqu'à trouver des trucs invraisemblables ("Liège" est devenu "LiÃfÆ'Ã?â?TÃfâ? ââ,¬â"¢ÃfÆ'ââ,¬Â Ãf¢ââ?s‰â?z¢ÃfÆ'Ã?â?TÃf¢ââ?s¬Ã.¡ÃfÆ'ââ,¬Å¡Ãfâ?sÃ,¨ge")
J'ai été jeté 1 coup d'oeil dans les résultats de Google Analytics, et chaque "version" du rewriting est indépendante des autres (logique).
Mais, d'après mes constatations ça fait du dégât du point de vue référencement (TRES mauvais positionnement des pages concernées, faut limite taper le nom de la page dans Google pour la trouver).
Mes conclusions, c'est que soit Google "dilue" la pertinence de la page entre chaque version, ou les déclasse pour duplicate content.
Pour régler ce problème, j'ai pensé à utiliser des redirections 301 dans mon .htaccess, pour à chaque fois renvoyer les "mauvais" rewritings vers le bon (et essayer de les remplacer dans l'index des moteurs de recherche).
Premier essai :
RedirectMatch Permanent page-1-b([^-]*)te([^-]*)erreur-2.html http://www.monsite.com/page-1-bete,erreur-2.html
Mais là, ça ne marche pas, Firefox me dit "Firefox a détecté que le serveur redirige la demande pour cette adresse d'une manière qui n'aboutira pas."
Deuxième essai :
RedirectMatch Permanent page-1-b([^t]*)te([^e]*)erreur-2.html http://www.monsite.com/page-1-bete,erreur-2.html
(ben oui, après la succession de ignes cabalistiques, on trouvera 1 t, et un e après la deuxième série)
Résultat : idem
Troisième essai :
RewriteRule ^page-1-b([^t]*)te([^e]*)erreur-2\.html$ page-1-bete,erreur-2.html [R=301]
(placé AVANT l'instruction de redirection
RewriteRule ^page-([0-9]{1,2}-([^-]*)-([0-9]{1,3})\.html$ page.php?param1=$1¶m2=$2¶m3=$3 [L])
Résultat : erreur 404...
Quatrième essai :
Même chose que le 3ème, mais en inversant les 2 instructions.
Résultat : erreur 404 aussi
J'ai encore essayé quelques variantes (remplacer le [L] par [R], par [QSA,L], par [R=301,L], ...), mais aucune n'a l'air de fonctionner correctement )
Savez-vous comment je peux faire pour "fusionner" ces URLs et faire en sorte que seule la "bonne" URL sorte à l'avenir dans les résultats de recherche?
Jusque là, pas trop grave, sauf que si on a une URL du genre :
page-1-bête erreur-2.html (qui renvoie sur page.php?num=$1&nom=$2&type=$3)
Dans les résultats de Google, on voit un truc du genre
page-1-b%E7te%20erreur-2.html
qui devient page-1-%C8E7te%C820erreur-2.html
ensuite page-1-%B3C8E7....
et ainsi de suite, jusqu'à trouver des trucs invraisemblables ("Liège" est devenu "LiÃfÆ'Ã?â?TÃfâ? ââ,¬â"¢ÃfÆ'ââ,¬Â Ãf¢ââ?s‰â?z¢ÃfÆ'Ã?â?TÃf¢ââ?s¬Ã.¡ÃfÆ'ââ,¬Å¡Ãfâ?sÃ,¨ge")
J'ai été jeté 1 coup d'oeil dans les résultats de Google Analytics, et chaque "version" du rewriting est indépendante des autres (logique).
Mais, d'après mes constatations ça fait du dégât du point de vue référencement (TRES mauvais positionnement des pages concernées, faut limite taper le nom de la page dans Google pour la trouver).
Mes conclusions, c'est que soit Google "dilue" la pertinence de la page entre chaque version, ou les déclasse pour duplicate content.
Pour régler ce problème, j'ai pensé à utiliser des redirections 301 dans mon .htaccess, pour à chaque fois renvoyer les "mauvais" rewritings vers le bon (et essayer de les remplacer dans l'index des moteurs de recherche).
Premier essai :
RedirectMatch Permanent page-1-b([^-]*)te([^-]*)erreur-2.html http://www.monsite.com/page-1-bete,erreur-2.html
Mais là, ça ne marche pas, Firefox me dit "Firefox a détecté que le serveur redirige la demande pour cette adresse d'une manière qui n'aboutira pas."
Deuxième essai :
RedirectMatch Permanent page-1-b([^t]*)te([^e]*)erreur-2.html http://www.monsite.com/page-1-bete,erreur-2.html
(ben oui, après la succession de ignes cabalistiques, on trouvera 1 t, et un e après la deuxième série)
Résultat : idem
Troisième essai :
RewriteRule ^page-1-b([^t]*)te([^e]*)erreur-2\.html$ page-1-bete,erreur-2.html [R=301]
(placé AVANT l'instruction de redirection
RewriteRule ^page-([0-9]{1,2}-([^-]*)-([0-9]{1,3})\.html$ page.php?param1=$1¶m2=$2¶m3=$3 [L])
Résultat : erreur 404...
Quatrième essai :
Même chose que le 3ème, mais en inversant les 2 instructions.
Résultat : erreur 404 aussi
J'ai encore essayé quelques variantes (remplacer le [L] par [R], par [QSA,L], par [R=301,L], ...), mais aucune n'a l'air de fonctionner correctement )
Savez-vous comment je peux faire pour "fusionner" ces URLs et faire en sorte que seule la "bonne" URL sorte à l'avenir dans les résultats de recherche?