Invalid URI in request GET

WRInaute occasionnel
Bonsoir.

Nous utilisons beaucoup l'adressage relatif sur nos pages or il semble qu'un certain nombre de robots interprètent mal l'adressage relatif, ce qui remplit nos logs d'erreurs Apache de ce genre de choses : "Invalid URI in request GET /../pages/page1.htm".

Serait-il envisageable à l'aide d'une réécriture d'url d'aider ces robots à retrouver leur chemin en redirigeant les requêtes invalides du type ../pages/page1.htm vers monsite/pages/page1.htm, ce qui revient à remplacer ".." par "monsite" avant de traiter la requête.

J'ai fait de nombreux tests hier soir pensant plusieurs fois tenir la solution mais j'ai finalement laissé tomber faute de grosses compétences en matière d'url rewriting.

L'un(e) d'entre-vous aurait déjà eu ce problème ?

D'avance merci de vos lumières.
 
WRInaute accro
Si je puis me permettre une remarque c'est la technique traditionnelle et bâtarde du patch que tu veux mettre en oeuvre.
En gros il y a un souci j'en remet une couche par dessus.

Je pense qu'il serait beaucoup plus simple de traiter le problème a la racine.

Si le contenu est en base un script qui parse les champs foireux prend pas longtemps a écrire pour transformer en url absolue (un simple CTRL+R sur un dump de base peu souvent suffire).

Si le contenu est en dur c'est une peu le même souci. Avec une IDE normale ça prend quelques minutes.

Ensuite un download quasi global et ou une restauration de base prend qques minutes pour régler le souci.
 
WRInaute occasionnel
Houla houla non ! C'est beaucoup plus simple que cela, il ne s'agit pas d'urls fabriquées à la volée au cours de l'extraction d'une base.

C'est juste une structure ultra-simple de pages html avec des liens relatifs en dur.
 
WRInaute accro
pourquoi vouloir utiliser des liens relatifs ? plutôt que d'écrire "../images/a.gif" pourquoi ne pas écrire "/images/a.gif" ? pas besoin d'avoir le ndd dans l'url, il suffit juste de commencer par /
 
WRInaute accro
christo27 a dit:
C'est juste une structure ultra-simple de pages html avec des liens relatifs en dur.
Bah tu charge tout le site dans une IDE genre éclipse ou autre et un simple Ctrl + R te permet de trouver et changer toutes les expressions qui ne conviennent pas. Ensuite c'est juste le temps de ré-uploader le tout. Si c'est un gros site il y en a pour une heure ou deux tout au plus (mais bon parfois je suis optimiste disons 3)
 
WRInaute occasionnel
Leonick a dit:
pourquoi vouloir utiliser des liens relatifs ? plutôt que d'écrire "../images/a.gif" pourquoi ne pas écrire "/images/a.gif" ? pas besoin d'avoir le ndd dans l'url, il suffit juste de commencer par /

Oui, la syntaxe "/images/image.gif" fonctionne aussi. Mais là, c'est mon Dreamweaver en local qui ne comprend plus rien mais, ça c'est mon problème, je vais me plonger dans les paramétrages de la bête.

Ceci-dit je confirme que certains spiders "maison" se mélangent les pédales lorsqu'ils tombent sur un adressage classique avec "../" contrairement à tous les grands navigateurs ou spiders qui circulent parfaitement.
 
WRInaute accro
en fait faut installer un serveur web en local et ne surtout jamais travailler sur du c:\...
c'est comme ça qu'on se retrouve avec un site web bancal, car des documents sont référencés dans les pages html en "c:/mes documents/..."
 
Discussions similaires
Haut