Google api: utf-8

WRInaute passionné
Je sais que j'avais lu la réponse ici ou sur un autre site, mais apres une longue recherche j'ai pas trouvé... donc si je suis pasé à coté dsl...


Comment on passe en sortie avec des accents normaux dans les résultats ?
car sinon on a des "Fédération française"

merci !
 
WRInaute passionné
Mitirapa,

Tu peux aussi configurer ton navigateur pour qu'il s'adapte automatiquement au charset de la page, non ?

Dan
 
WRInaute discret
Exact... Sous IE c'est 2eme Boutton Codage..

Ce genre de phenomene peut venir de 2 endroits:
  • Le navigateur est mal reglé (Comme c'est le cas ici..)
  • Le moteur n'envoie pas les bons entête de codage (Overture.fr avait ce probleme il y a peut de temps..).
 
WRInaute discret
Mitirapa a dit:
Je sais que j'avais lu la réponse ici ou sur un autre site, mais apres une longue recherche j'ai pas trouvé... donc si je suis pasé à coté dsl...


Comment on passe en sortie avec des accents normaux dans les résultats ?
car sinon on a des "Fédération française"

merci !

Le texte renvoye par l'api est encodé en utf8. Tu dois le decoder de utf8 vers ton jeu de charactere pour le lire correctement.

Idem, si tu veux faire une requete avec accent, encode ton texte en utf8 avant.

Il me semble que nusoap (php) le fait pour toi (a verifier).

En perl, il y a un module qui s'en charge: Unicode::MapUTF8
 
WRInaute passionné
ok j'ai cherché sur nusoap et en fait j'ai trouvé au passage la fonction php utf8_decode que je n'avais meme pas vu !

donc un
$hit["title"]=utf8_decode($hit["title"]);
$hit["snippet"]=utf8_decode($hit["snippet"]);
suffit a bien coder les résultats :wink:
 
WRInaute discret
Attention si vous avez internet explorer 6 avec sp1.
lisez ceci http://www.microsoft.com/windows/ie_int ... readme.htm

au milieu de la page cherchez le titre :
"Caractères non anglais dans les URL et les requêtes"

on peut y lire ceci :

REMARQUES DESTINÉES AUX CLIENTS

Caractères non anglais dans les URL et les requêtes

Internet Explorer 6 SP 1 utilise une nouvelle norme pour transmettre au serveur les adresses (URL) écrites en caractères non anglais. Les URL sont désormais codées selon la norme UTF-8. Si le serveur exécute Windows 2000, les URL sont interprétées de manière appropriée. De nombreux serveurs ne peuvent pas traiter les URL codées en UTF-8.

Pour utiliser des caractères non anglais dans les URL envoyées aux serveurs qui ne gèrent pas le codage UTF-8

Dans le menu Outils du navigateur, cliquez sur Options Internet.
Cliquez sur l'onglet Avancé.
Sous Navigation, désactivez la case à cocher Toujours envoyer les URL en tant que UTF-8. La partie requête des URL est transmise sous une forme entièrement compatible avec Internet Explorer 4 et les versions ultérieures.

J'ai eu pas mal de probleme mon site étant hebergé chez ovh (serveur linux)
voir ce topic :
https://www.webrankinfo.com/forum/t/expression-reguliere-dun-nom-propre.4315/
 
Discussions similaires
Haut