URL avec caractères spéciaux

  • Auteur de la discussion Auteur de la discussion sietjp
  • Date de début Date de début
WRInaute occasionnel
Bonjour,
J'aimerais savoir si certains d'entre vous ont déjà créé des urls avec caractères spéciaux et avoir des retours d'expérience en terme de référencement et des conseils sur l'utilisation des urls avec caractères étrangers par exemple -www.tatatitata.com/宴会.html . Est ce que c'est reconnu par tous les moteurs ?
 
WRInaute occasionnel
Pourquoi? Visiblement d'après la recherche de rottman, wikipedia l'utilise et ils ne sont pas tropmauvais chez wikipedia visiblement.
 
WRInaute accro
Bonjour,

Cela dépend peut-être de ton objectif avec les caractères spéciaux. Si on parle d'un site en français avec, comme caractères spéciaux, les "é", "è",... et les " " (espace) et compagnie, il faut les éviter.

Exemple : dans l'URL de ta page http://sietjp.free.fr/galerie/peintures.php?params=Serge%20Cabanel%20_DIRECTOR_0, Google ne reconnaît pas le mot Cabanel, mais il reconnaît le mot 20Cabanel, ce qui n'était probablement pas le but recherché...

Pour d'autres caractères étrangers (langues asiatiques, arabe,...), je ne sais pas si le même raisonnement peut être appliqué.

Jean-Luc
 
WRInaute accro
D'accord avec toi.

C'est lié à la question des "séparateurs de mots". J'ai mis en ligne un résumé de ce que j'ai constaté à ce sujet : http://www.annuaire-info.com/google-separateur.html. Il y a un paragraphe "Séparateurs dans l'adresse de la page (URL)".

Jean-Luc
 
Nouveau WRInaute
en tout cas Google reconnaît les accents dans les URL:

tape jute émoticonne dans google et tu verras émoticonne (url accentuée) non seulement en première page.... mais en première position.

Continuons à dormir, le réveil sera dur.

Ciào
 
WRInaute accro
oui dabsi, c'est récent les accents dans les domaines, beaucoup de personnes se sont fait 'voler' leur nom de domaine par quelqu'un qui a simplement ajouté un accent (c'est le cas de emoticonne)
 
WRInaute accro
Bonjour dabsi,


dabsi a dit:
en tout cas Google reconnaît les accents dans les URL:
tape jute émoticonne dans google et tu verras émoticonne (url accentuée) non seulement en première page.... mais en première position.
Ce n'est pas parce que Google affiche ce résultat en première position qu'il a reconnu le mot dans l'URL.

D'ailleurs, la recherche inurl:émoticonne ne donne aucun résultat et la recherche inurl:emoticonne n'inclut pas www.émoticonne.com.


dabsi a dit:
Continuons à dormir, le réveil sera dur.
Rien de tel qu'une bonne sieste pour garder les idées claires. :wink:


Jean-Luc
 
WRInaute passionné
Hello les WRInautes,

Je relance cette discussion puisque je me trouve dans le cas de figure concerné.

J'utilise en effet la fonction urlencode() pour traiter des chaines de caractères contenues dans mes tables et gérer mes url.

Donc à tout hasard, pur m'éviter d'avoir à ajouter un champ où je saisirai moi-même la chaine url souhaité, est-ce que vous avez une fonction sous le coude qui pourrait me dépanner, en "traitant" mes chaines sans ajouter tous ces caractères indésirables ?

A+, Fab le Fou :twisted:
 
WRInaute accro
il faut que tu fasse toi meme tous les str_replace
voici ce que j'utilise pour le site de mon profil
tous les caracteres ne sont pas présents, mais des que je vois un pb, je rajoute le caractere adéquat

Code:
function formaturl($url) {
$url = strtolower($url);
$url = str_replace(" ", "-", $url);
$url = str_replace(".", "-", $url);
$url = str_replace(" ", "-", $url);
$url = str_replace("'", "", $url);
$url = str_replace("’", "", $url);
$url = str_replace(",", "", $url);
$url = str_replace("(", "", $url);
$url = str_replace(")", "", $url);

$url = str_replace("!", "", $url);
$url = str_replace("?", "", $url);
$url = str_replace("\"", "", $url);
$url = str_replace(":", "", $url);

$url = str_replace("é", "e", $url);
$url = str_replace("è", "e", $url);
$url = str_replace("ê", "e", $url);
$url = str_replace("ë", "e", $url);
$url = str_replace("à", "a", $url);
$url = str_replace("ù", "u", $url);


$url = str_replace("--", "-", $url);
$url = str_replace("--", "-", $url);
return $url;
}
 
WRInaute occasionnel
Je fais aussi comme ça mais en utilisant des tableaux avec str_replace pour des performances accrues, par exemple :
Code:
$from   = array('é','è'); 
$to     = array('e', 'e');
$chaine=str_replace($from, $to, $chaine);
 
WRInaute passionné
caractères spéciaux et XML/RSS

Ok merci KaZhaR et sietjp ! :D
ça semble déjà bien complet...

Je dévie un peu par rapport au problèmes d'url mais j'ai aussi rencontré quelques problèmes pour valider mes files RSS.

En fait, ils sembles fonctionner (en tous cas dans l'annuaire de WRI) mais certains caractères (notamment le "-") ne semblent pas convenir au site : http://feedvalidator.org/.

J'ai donc essayé des fonctions telles que htmlentities(), mais là c'est encore pire !

Pas très grave, puisque ça marche quand même mais bon sur le principe j'aimerais bien comprendre le problème...

Fab

PS: j'ai bien précisé l'encoding "iso-8859-1" au début de mes fichiers xml...
 
Discussions similaires
Haut