En résumé :
- Google indique cette erreur quand il n'a pas pu accéder à votre sitemap
- Souvent, le sitemap est inaccessible, au moins pour Google
- Voici les vérifications à faire pour corriger l'erreur
Ce dossier va vous servir si vous avez cette erreur affichée dans la liste de vos sitemaps dans la Search Console :

Et quand vous cliquez sur la ligne pour en savoir plus, vous avez :

Vérifiez chacun des points suivants dans l'ordre...
Raison 1 : l'URL du sitemap est incorrecte
La première chose à vérifier est l'URL de votre sitemap : elle doit être accessible directement.
🔎 Comment vérifier ? Ne vous contentez pas de la consulter dans votre navigateur. Utilisez un outil qui analyse le code HTTP, comme httpstatus.io. Vous devez obtenir un code 200, indiquant que l'URL est accessible.
☑️ Comment corriger ? Si l'URL de votre sitemap redirige vers une autre URL qui renvoie un code 200, cela ne suffit pas. L'URL que vous fournissez à Google doit être celle qui renvoie directement le code 200.
💡 Pour en savoir plus : liste des codes HTTP
Raison 2 : l'URL du sitemap est bloquée au crawl
Il se peut que votre sitemap soit interdit de crawl en raison d'une règle dans votre fichier robots.txt. Google respecte ces règles lors de la récupération des sitemaps.
🔎 Comment vérifier ? Vérifiez votre fichier robots.txt pour voir s'il y a une directive Disallow
qui concerne votre sitemap. Si vous n'êtes pas sûr de savoir comment vérifier cela, vous pouvez entrer l'URL de votre sitemap directement dans l'inspecteur d'URL de Google Search Console.
☑️ Comment corriger ? Retirez cette règle pour permettre à Google de récupérer votre sitemap.
💡 Pour en savoir plus : le guide du fichier robots.txt
Raison 3 : Google est bloqué sur votre site
Une configuration de votre site peut bloquer l'accès à Googlebot, le robot de Google.
🔎 Comment vérifier ? Certains plugins de sécurité, comme All-In-One WP Security, peuvent bloquer les faux Googlebot. Assurez-vous que ces plugins ne bloquent pas accidentellement le vrai Googlebot.
Vérifiez également les paramètres de mise en cache de votre site. Désactivez temporairement la mise en cache pour vous assurer qu'elle ne cause pas de problèmes avec le sitemap.
Contactez votre hébergeur pour vous assurer qu'aucun blocage d'IP ou autre n'est en place. Je l'ai vu à plusieurs reprises, notamment chez OVH.
Utilisez l'outil d'inspection d'URL de Google Search Console pour vérifier si Googlebot peut accéder à votre sitemap. Assurez-vous que la section "Récupération de page" indique "Réussie".
☑️ Comment corriger ? Tout dépend du blocage que vous avez identifié.
Raison 4 : votre site a une pénalité manuelle Google
🔎 Comment vérifier ? Vérifiez si votre site a une "action manuelle" en allant dans Google Search Console sous "Sécurité et actions manuelles" > "Actions manuelles".
☑️ Comment corriger ? Si c'est le cas, votre priorité est de résoudre ce problème. Tant que la pénalité manuelle est en place, Google ne cherchera pas à crawler votre sitemap. Tout dépend du type de pénalité.
Raison 5 : votre site est globalement de qualité trop faible
Google indique clairement que :
Plus la qualité du contenu de votre site est élevée, plus le besoin d'exploration du sitemap est important. Si la qualité est trop faible, Google peut ne pas venir récupérer votre sitemap.
Documentation Google (source)
🔎 Comment vérifier ? Lancez un audit RM Tech et examinez votre matrice QualityRisk Zombies. Vous devez avoir le maximum de cases remplies dans le coin inférieur gauche (cases en bleu).

☑️ Comment corriger ? Si vous avez beaucoup de cases dans la zone supérieure de la matrice, vous devez :
- Améliorer de nombreuses pages
- Éventuellement supprimer celles qui n'ont aucune chance d'être améliorées
💡 Pour en savoir plus : je vous offre un audit RM Tech en version gratuite pour tester votre matrice. Ensuite, utilisez RM Console pour optimiser vos pages et améliorer la qualité du site.
Raison 6 : le format du sitemap est incorrect
Bien que ce ne soit probablement pas le problème ici, il est toujours bon de vérifier le format de votre sitemap.
🔎 Comment vérifier ? Utilisez un validateur XML pour détecter toute erreur de syntaxe, comme des balises mal fermées ou un encodage incorrect. Votre sitemap doit respecter les normes du protocole sitemaps.org.
Vous pouvez utiliser un outil comme XML-Sitemaps.com pour valider votre sitemap. Assurez-vous également qu'il est encodé en UTF-8.
☑️ Comment corriger ? Tenez compte des remarques du validateur de sitemap.
💡 Pour en savoir plus : lisez mon guide du format sitemap XML
Pour finir
Si, après avoir suivi toutes ces étapes, le problème persiste, il peut être utile d'attendre quelques jours ou semaines. Parfois, l'erreur peut se résoudre d'elle-même.
N'oubliez pas de soumettre à nouveau l'URL de votre sitemap dans Google Search Console après avoir effectué ces vérifications.
En suivant ces conseils, vous devriez être en mesure de résoudre l'erreur "Impossible de récupérer le sitemap" et d'améliorer la visibilité de votre site sur Google.
Vos questions
Si vous avez cette erreur, c'est que l'URL de votre sitemap n'est pas accessible (code 200), par exemple elle renvoie un code 404. Vérifiez bien son URL dans un outil de test HTTP.
Ce message d'erreur s'affiche quand le format de votre fichier sitemap est incorrect. Vérifiez-le avec un validateur de sitemap XML. Relisez les différents points listés dans ce dossier.
Ce message signifie généralement que Google n'a pas pu récupérer ou analyser correctement votre fichier sitemap. Utilisez l'inspecteur d'URL de la Search Console en indiquant l'URL du sitemap ou bien patientez quelques jours.
Si vous avez des questions, posez-les dans le forum WebRankInfo.
Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.
➡️ Offre MyRankingMetrics ⬅️
pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)
Voir les détails ici

Laisser un commentaire