WRInaute passionné
Cette nuit, j'ai parcourru le forum à la recherche de posts à recommander et je suis tombé sur des discussions récentes ou anciennes qui m'ammenent à publier ces précisions à l'attention de tous les wenmasters débutants.
1 - Concernant l'url rewriting:
On lit ça et là que l'url rewriting est dangereux pour le référencement car les moteurs devinnent que la technique est utilisée pour ajouter des pages artificiellement, en gros, un site avec 100.000 pages html est louche pour les moteurs de recherche.
Arrétons les bétises! Un moteur ou un internaute n'a aucun moyen de savoir si le site est rewrité ou pas!!!
Les seuls cas ou cela peut se deviner sont:
- site partiellement rewrité (exemple WRI)
- site utilisant un source public et connu (exemple PHPBB pour WRI)
- site ou l'accés aux infos sur le serveur est public et non protégé (genre apache-status ou phpinfo) et encore, cela ne prouve en aucun cas que le rewriting est utilisé mais seulement possible.
De plus, un site totalement et bien rewrité accroit la sécurité face aux tentative d'injection de variables dans vos script php (sans rewriting, les variable sont visibles et cela necessite certaines précautions)
Conclusion: Le rewriting n'est pas pénalisant pour le référencement. En proposant une arborescence et des url lisibles, il facilite le travail des bots et l'indexation des pages. (notez bien que je ne me prononce pas sur l'amélioration du positionnement dans les résultats de recherche car cela est une autre histoire qui ne depends pas de la technique d'url rewriting mais de son utilisation)
2 - l'url rewriting à toutes les sauces
Une question récurrente sur WRI est "comment eviter qu'un site XXX utilise les images du site YYY" et la réponse régulièrement apportée et "url rewriting".
Le fichier htaccess sert à faire autre chose que du rewriting! Il sert avant tout à modifier localement la configuration apache.
Pour eviter que les fichiers contenues dans un répertoire soient utilisées par d'autre sites, mettez un hthaccess de ce type dans le répertoire:
<Files *>
Order Allow, Deny
Deny from all
Allow from .mondomaine.com
</Files>
Par défaut, Apache applique les restrictions du fichier .htaccess à l'ensemble des fichiers du répertoire dans lequel il se trouve ainsi qu'à tous les fichiers contenus dans ses sous-répertoires. Si vous souhaitez protéger uniquement des fichiers jpg, remplacer "*" par "*.jpg".
3 - Concernant les urls absolus et relatives
Là aussi, on lit de tout et la plupart du temps il y a confusion entre url absolus et relatives. Il n'est pas nécéssaire d'ajouter http://www.example.com pour faire une url absolue!
/mondossier/mapage.html est une url absolue
mondossier/mapage.html est une url relative
Il est vrai que apache fait la conversion de relatif en absolue mais il le fait en présence d'un contexte. Sortie de son contexte (c.a.d. la page ou l'url est utilisée), une url relative ne veut plus rien dire.
En terme de référencement, il n'y a aucune raison technique, objective (et même subjective) pour que l'une ou l'autre de ces écritures pénalise ou améliore le référencement. Par contre, il est probable qu'avec une url relative, le bot doit effectuer une opération de conversion en tenant compte du contexte ce qui doit forcement augmenter les temps d'indexation (imaginez un deep crawl sur un site de 100.000 pages comprennant 20 urls relative par page!)
Conclusion: urls relatives ou absolues ne changent en rien votre référencement. Cependant, suivez les conseils des moteurs de recherches pour faciliter le travail des bots et utilisez des url absolues. :wink:
4 - ne pas confondre référencement, indexation et positionnement!
En effet ce sont des choses différentes. L'indexation est la prise en compte d'une page par un moteur de recherche, le positionnement c'est la position de cette page pour une requete donnée, le référencement c'est l'ensemble des actions à mener pour obtenir une indexation de ses pages ainsi qu'un positionnement de celle-ci dans les moteurs de recherche sur des mots clés définis. (je fais volontairement un raccourci en ne traitant que ces trois actions).
Il y a des tonnes de choses que l'on peut faire pour améliorer l'indexation de ces pages en terme d'efficacité, de rapidité d'indexation, de quantité de page indéxées qui ne modifieront en rien le positionnement!!!
Les actions pour ameliorer l'indexation de ses pages sont objectives (liens de navigation, syntaxe du code, lien vers ces pages, contenu de la page etc.. etc...). Les actions pour améliorer son positionnement sont bien plus subjectives (choix des mots clés, adéquation avec la thématique de la page, backlinks etc...) et surtout les résultats sont bien plus fluctuants pour l'unique raison que vous n'êtes pas tout seul sur le web!
Il est trés étrange qu'un webmasters qui poste "j'étais premier et maintenant je suis 15éme" n'imaginent jamais que les 14 webasters qui lui sont passé devant ont pu faire ce qu'il fallait pour cela...(si, si, le webmaster est nombriliste :wink: )
Conclusion: Une bonne indexation est obtenue par l'utilisation de techniques (généralement identifiées). Un bon positionnement, c'est une lutte de tous les instant contre des concurrents et il n'y a aucune recette miracle !
5 - Hors google, point de salut pour un site.
La aussi, même si google est de loin le premier outils de recherche sur le web, il y a des tonnes de sites qui vivent trés bien avec 10% de trafic venant de google! Alors pas de panique si vous n'étes pas dans le top dix, cela ne veut pas dire que votre site est sans intérêt (et puis, les sites dans le top dix,ne sont pas pour autant dignes d'interêt! :wink: )
Les moteurs de recherche ne font pas tout, c'est l'interet que porte un internaute à un site qui importe. Posez-vous la question de savoir si en terme de gain de trafic, il vaut mieux passer des heures en optimisation de référencement pour gagner hypothétiquement quelques places dans les résultats de recherche, ou bien consacrer ces mêmes heures à travailler les contenus de son site?
On ne le redira jamais assez, travaillez vos contenus, au lieu de regarder vos stats toutes les 5 minutes. (Lorsque vous aurez des employés pour s'occuper de votre site, là vous pourrez passer votre temps à regarder les stats en fumant le cigare un bon verre à la main :wink: )
Voilà. J'espère ne pas vous avoir soulé avec mes recommendations parfois vindicatives
, mais en parcourrant WRI cette nuit, j'ai failli avoir une attaque! 
1 - Concernant l'url rewriting:
On lit ça et là que l'url rewriting est dangereux pour le référencement car les moteurs devinnent que la technique est utilisée pour ajouter des pages artificiellement, en gros, un site avec 100.000 pages html est louche pour les moteurs de recherche.
Arrétons les bétises! Un moteur ou un internaute n'a aucun moyen de savoir si le site est rewrité ou pas!!!
Les seuls cas ou cela peut se deviner sont:
- site partiellement rewrité (exemple WRI)
- site utilisant un source public et connu (exemple PHPBB pour WRI)
- site ou l'accés aux infos sur le serveur est public et non protégé (genre apache-status ou phpinfo) et encore, cela ne prouve en aucun cas que le rewriting est utilisé mais seulement possible.
De plus, un site totalement et bien rewrité accroit la sécurité face aux tentative d'injection de variables dans vos script php (sans rewriting, les variable sont visibles et cela necessite certaines précautions)
Conclusion: Le rewriting n'est pas pénalisant pour le référencement. En proposant une arborescence et des url lisibles, il facilite le travail des bots et l'indexation des pages. (notez bien que je ne me prononce pas sur l'amélioration du positionnement dans les résultats de recherche car cela est une autre histoire qui ne depends pas de la technique d'url rewriting mais de son utilisation)
2 - l'url rewriting à toutes les sauces
Une question récurrente sur WRI est "comment eviter qu'un site XXX utilise les images du site YYY" et la réponse régulièrement apportée et "url rewriting".
Le fichier htaccess sert à faire autre chose que du rewriting! Il sert avant tout à modifier localement la configuration apache.
Pour eviter que les fichiers contenues dans un répertoire soient utilisées par d'autre sites, mettez un hthaccess de ce type dans le répertoire:
<Files *>
Order Allow, Deny
Deny from all
Allow from .mondomaine.com
</Files>
Par défaut, Apache applique les restrictions du fichier .htaccess à l'ensemble des fichiers du répertoire dans lequel il se trouve ainsi qu'à tous les fichiers contenus dans ses sous-répertoires. Si vous souhaitez protéger uniquement des fichiers jpg, remplacer "*" par "*.jpg".
3 - Concernant les urls absolus et relatives
Là aussi, on lit de tout et la plupart du temps il y a confusion entre url absolus et relatives. Il n'est pas nécéssaire d'ajouter http://www.example.com pour faire une url absolue!
/mondossier/mapage.html est une url absolue
mondossier/mapage.html est une url relative
Il est vrai que apache fait la conversion de relatif en absolue mais il le fait en présence d'un contexte. Sortie de son contexte (c.a.d. la page ou l'url est utilisée), une url relative ne veut plus rien dire.
En terme de référencement, il n'y a aucune raison technique, objective (et même subjective) pour que l'une ou l'autre de ces écritures pénalise ou améliore le référencement. Par contre, il est probable qu'avec une url relative, le bot doit effectuer une opération de conversion en tenant compte du contexte ce qui doit forcement augmenter les temps d'indexation (imaginez un deep crawl sur un site de 100.000 pages comprennant 20 urls relative par page!)
Conclusion: urls relatives ou absolues ne changent en rien votre référencement. Cependant, suivez les conseils des moteurs de recherches pour faciliter le travail des bots et utilisez des url absolues. :wink:
4 - ne pas confondre référencement, indexation et positionnement!
En effet ce sont des choses différentes. L'indexation est la prise en compte d'une page par un moteur de recherche, le positionnement c'est la position de cette page pour une requete donnée, le référencement c'est l'ensemble des actions à mener pour obtenir une indexation de ses pages ainsi qu'un positionnement de celle-ci dans les moteurs de recherche sur des mots clés définis. (je fais volontairement un raccourci en ne traitant que ces trois actions).
Il y a des tonnes de choses que l'on peut faire pour améliorer l'indexation de ces pages en terme d'efficacité, de rapidité d'indexation, de quantité de page indéxées qui ne modifieront en rien le positionnement!!!
Les actions pour ameliorer l'indexation de ses pages sont objectives (liens de navigation, syntaxe du code, lien vers ces pages, contenu de la page etc.. etc...). Les actions pour améliorer son positionnement sont bien plus subjectives (choix des mots clés, adéquation avec la thématique de la page, backlinks etc...) et surtout les résultats sont bien plus fluctuants pour l'unique raison que vous n'êtes pas tout seul sur le web!
Il est trés étrange qu'un webmasters qui poste "j'étais premier et maintenant je suis 15éme" n'imaginent jamais que les 14 webasters qui lui sont passé devant ont pu faire ce qu'il fallait pour cela...(si, si, le webmaster est nombriliste :wink: )
Conclusion: Une bonne indexation est obtenue par l'utilisation de techniques (généralement identifiées). Un bon positionnement, c'est une lutte de tous les instant contre des concurrents et il n'y a aucune recette miracle !
5 - Hors google, point de salut pour un site.
La aussi, même si google est de loin le premier outils de recherche sur le web, il y a des tonnes de sites qui vivent trés bien avec 10% de trafic venant de google! Alors pas de panique si vous n'étes pas dans le top dix, cela ne veut pas dire que votre site est sans intérêt (et puis, les sites dans le top dix,ne sont pas pour autant dignes d'interêt! :wink: )
Les moteurs de recherche ne font pas tout, c'est l'interet que porte un internaute à un site qui importe. Posez-vous la question de savoir si en terme de gain de trafic, il vaut mieux passer des heures en optimisation de référencement pour gagner hypothétiquement quelques places dans les résultats de recherche, ou bien consacrer ces mêmes heures à travailler les contenus de son site?
On ne le redira jamais assez, travaillez vos contenus, au lieu de regarder vos stats toutes les 5 minutes. (Lorsque vous aurez des employés pour s'occuper de votre site, là vous pourrez passer votre temps à regarder les stats en fumant le cigare un bon verre à la main :wink: )
Voilà. J'espère ne pas vous avoir soulé avec mes recommendations parfois vindicatives

