Salut à tous !
J'ai eu la mauvaise surprise tout à l'heure de constater que Google indexe les URL qui commencent par "%20" ! Le site http://www.bacplusdeux.com/spip/article.php3?id_article=237 a mis un lien vers http://%20%20%20%20%20%20%20%20%20%20annuaire.audiencestv.com et du coup je me retrouve avec ça :
URL INCORRECTE MAIS MALGRE TOUT INDEXEE PAR GOOGLE
Je cherche une solution avant de me retrouver avec du duplicate content comme c'est le cas pour ce site :
urls avec %20 => urls sans %20
J'ai essayé la redirection 301 via .htaccess mais ça n'a pas l'air de marcher car il ignore le signe % dans le domaine. Ainsi un :
n'aura aucun effet 
D'ailleurs si je vérifie le contenu de la variable HTTP_HOST via PHP, il me dit que c'est égal à "annuaire.audiencestv.com" et non "%20%20%20%20%20%20%20%20%20%20annuaire.audiencestv.com". Comment résoudre le problème si les "%20" ne sont même pas dans les variables d'environnement :?
Si vous avez une solution ce serait vraiment cool
j'ai pas trop compris pourquoi Google indexe de telles urls. Ce qui est inquiétant c'est que n'importe qui - volontairement ou non - peut apparemment générer du Duplicate Content en faisant un lien vers http://%20www.xxx.com ... et si tous les liens de ce site sont relatifs et non absolus ......... :?
PJ.
PS : Je m'excuse si ce problème a déjà été traité mais impossible de faire une recherche dans les anciens messages du forum car le caractère "%" est ignoré par le moteur de recherche WRI.
J'ai eu la mauvaise surprise tout à l'heure de constater que Google indexe les URL qui commencent par "%20" ! Le site http://www.bacplusdeux.com/spip/article.php3?id_article=237 a mis un lien vers http://%20%20%20%20%20%20%20%20%20%20annuaire.audiencestv.com et du coup je me retrouve avec ça :
URL INCORRECTE MAIS MALGRE TOUT INDEXEE PAR GOOGLE
Je cherche une solution avant de me retrouver avec du duplicate content comme c'est le cas pour ce site :
urls avec %20 => urls sans %20
J'ai essayé la redirection 301 via .htaccess mais ça n'a pas l'air de marcher car il ignore le signe % dans le domaine. Ainsi un :
Code:
RewriteCond %{HTTP_HOST} ^%20
RewriteRule ^(.*) http://annuaire.audiencestv.com/$1 [R=301,L]

D'ailleurs si je vérifie le contenu de la variable HTTP_HOST via PHP, il me dit que c'est égal à "annuaire.audiencestv.com" et non "%20%20%20%20%20%20%20%20%20%20annuaire.audiencestv.com". Comment résoudre le problème si les "%20" ne sont même pas dans les variables d'environnement :?
Si vous avez une solution ce serait vraiment cool

PJ.
PS : Je m'excuse si ce problème a déjà été traité mais impossible de faire une recherche dans les anciens messages du forum car le caractère "%" est ignoré par le moteur de recherche WRI.