Comment gérer simplement les sitemaps de plusieurs sites au même endroit
Si vous gérez plusieurs sites, vous avez peut-être rencontré le cas où ça aurait été plus simple pour vous de centraliser au même endroit (sur un même site) tous les sitemaps de ces différents sites. C'était possible depuis octobre 2007 mais un peu compliqué, aujourd'hui c'est facilité par le biais du fichier robots.txt : explications...On va reprendre ça calmement et dans l'ordre :
- Google (et les autres moteurs) permet au webmaster de lister les pages de son site qu'il veut voir crawlées et indexées : il suffit de créer un fichier sitemap
- Ce fichier sitemap est un fichier XML ou texte stocké sur le site concerné
- S'il n'a pas déjà créé un compte Search Console, le webmaster doit prouver à Google qu'il est bien l'éditeur du site : pour cela il doit uploader un fichier spécifique (ou mettre une balise meta dans sa page d'accueil). On appelle ça la phase de vérification.
- Le webmaster doit ensuite indiquer à Google où se trouve ce fichier sitemap : pour cela il utilise son compte Google Webmaster Tools, ou plus simplement depuis avril 2007 en indiquant l'adresse du fichier sitemap dans le fichier robots.txt
- S'il a plusieurs sites à gérer (ou plusieurs sous-domaines du même site), il peut répéter le processus ci-dessus autant de fois que nécessaire, mais ça peut devenir assez laborieux.
- Depuis octobre 2007 Google permet au webmaster de mettre tous ses fichiers sitemaps (de différents sites) au même endroit (sur un seul serveur) à condition de passer la phase de vérification de chaque site (ou sous-domaine)
- A partir de maintenant il n'est plus obligatoire de procéder à ces différentes vérifications, il suffit d'indiquer dans le fichier robots.txt l'adresse du sitemap, même s'il est hébergé sur un autre site.
- avant il fallait prouver que vous êtes le webmaster des 2 sites en procédant à la vérification de www.site1.com et de www.site2.com
- maintenant il suffit pour le site secondaire www.site2.com de mettre une ligne dans son fichier robots.txt qui indique que le fichier sitemap de www.site2.com se trouve quelquepart sur www.site1.com
Sitemap:
Si mes explications ne sont pas claires, lisez celles de Google qui le seront peut-être plus !