En résumé :
- vous faites bien de fournir un sitemap listant vos pages à indexer
- mais ça ne garantit pas que 100% des URL soient indexées
- apprenez à voir le taux d'indexation du sitemap
- et découvrez comment optimiser l'indexation
Taux d'indexation des URL d'un fichier sitemap
Normalement, les URL que vous fournissez dans un ou plusieurs fichiers sitemaps devraient être indexées par Google - au bout d'un certain temps.
Je vous propose de commencer par calculer le taux d'indexation. Voici les étapes :
- allez dans votre compte Google Search Console
- allez dans la section Indexation > Pages
- en haut, à la place de "Toutes les pages connues", choisissez le sitemap à analyser
- Google affiche le nombre de pages "non indexées" et "dans l'index"
taux d'indexation = "dans l'index" / ("non indexées" + "dans l'index")

La procédure est identique dans Bing Webmaster Tools.
OK alors si votre taux est trop faible, lisez la suite...
Raisons techniques d'une non-indexation
Il existe plusieurs raisons techniques qui font qu'une URL ne peut pas être indexée :
- si elle renvoie un autre code HTTP que 200, elle n'est pas accessible de façon correcte et ne peut pas être indexée
- si elle est bloquée dans le fichier robots.txt et que Google ne l'a pas encore indexée, étant donné qu'il n'est pas autorisé à la crawler, il ne pourra pas l'indexer
- si elle contient une balise meta robots noindex ou none, elle sera crawlée mais pas indexée
- si un entête HTTP X-Robot-Tag noindex ou none est envoyé pour cette URL, elle sera crawlée mais pas indexée
- si l'URL contient une URL canonique différente, il est probable que Google l'indexe mais sous l'autre URL (la canonique). Si vous n'êtes pas à l'aise avec les URL canoniques, lisez mon tutoriel
- si le type MIME n'est pas pris en charge par Google, elle ne sera pas indexée. Dans votre sitemap, mettez des URL de documents HTML ou PDF, Word, etc. mais pas des formats de fichiers inconnus.
Ça, c'était uniquement les raisons techniques. Passons à la suite
Pourquoi Google n'indexe pas toutes les pages
Voici quelques pistes qui pourraient expliquer un taux de pages indexées trop faible :
- le maillage interne n’est pas optimal : trop de pages sont trop profondes, c’est-à-dire accessibles en trop de clics (sur des balises a href) depuis la page d’accueil. Pour calculer la profondeur de chacune des URL de votre site, utilisez mon outil My Ranking Metrics pour lancer un audit "RM Tech". Vous pourrez ainsi identifier le genre de pages trop profondes afin de réduire leur profondeur. Au passage, 100% des pages de votre site seront passées au crible de plusieurs dizaines de critères techniques SEO, ce qui devrait vous aider à progresser ;-)
- le site contient de nombreuses pages sans contenu (pas de produit disponible par exemple) ou trop similaires (contenu presque dupliqué)
- le site ne dispose pas d’assez de backlinks profonds (c'est-à-dire pointant vers une page interne de votre site, pas la page d'accueil)
- éventuellement : trop peu d’internautes consultent vos pages (Google vient parfois crawler des pages repérées via de nombreuses visites d’internautes avec Chrome)
Précisions sur les rapports de la Search Console
Il peut aussi y avoir des explications liées au fonctionnement de Google Search Console.
Les nombres d'URL indiqués par Google pour les sitemaps sont actualisés une fois par jour. Si vous comparez à l'état de l'indexation (autre rapport de GSC), celui-ci n'est actualisé qu'une fois par semaine.
Enfin, il arrive parfois qu'un bug chez Google perturbe l'analyse. Par exemple, le nombre d'URL indexées peut être inférieur à la réalité en raison d'un bug reconnu officiellement par Gary Illyes en juillet 2015 (et corrigé ensuite : source).
Comment faire indexer une page immédiatement par Google
Pour faire indexer une page en particulier, c’est simple et rapide avec Google Search Console :
- allez dans votre compte Google Search Console
- en haut, dans le formulaire, indiquez l'URL à faire indexer et validez
- cliquez sur "Demander une indexation"
Au bout de quelques heures, un jour maximum, la page devrait être indexée. Mais d'une part ce procédé manuel devrait rester exceptionnel, d'autre part, ça ne fonctionne pas toujours.
Si ça ne suffit pas, c'est que vous avez un problème sur votre site, pas forcément sur la page qui ne veut pas s'indexer. C'est un problème plus global de qualité de l'ensemble de votre site. Pour l'évaluer très facilement, la matrice QualityRisk Zombie est une analyse très efficace.
Si vous avez des questions, posez-les dans le forum WebRankInfo.
Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.
➡️ Offre MyRankingMetrics ⬅️
pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)
Voir les détails ici

salut Olivier,
Je rencontre ce cas de figure avec un site : les articles de blog s'indexent mal.
Penses-tu que le fait que chaque article possède une DIZAINE de liens internes vers d'autres articles ou des pages produits soit un chiffre trop élevé = 10 liens internes par article ?
Quid de ce critère ?
merci
Non ce n'est pas un pb de faire des liens vers d'autres articles, au contraire.
J'ai fait "explorer comme google/envoyer pour indexation" pour 3 pages récalcitrantes, mais j'ai l'impression qu'elles sont présentes dans l'index par intermittence, curieux non ?
Peut-être que les pages sont trop ressemblantes à d'autres, ou avec trop peu de qualité/valeur ajoutée. Ou bien la manière de tester l'indexation n'est pas fiable.
Bonjour. Vous dîtes que l'usage de la fonctionnalité "Envoyer pour indexation" doit rester exceptionnel. Sachant que nous avons un quota de 500 demandes, pourquoi ne pas en profiter pour envoyer toutes les pages intéressantes et éviter le plagiat du contenu. J'entends par là d'utiliser cette fonctionnalité pour les articles et autres pages à contenu de qualité. Et puis l'indexation automatique est parfois très longue...une perte de temps d'attendre non ?
l'indexation automatique ne devrait pas excéder quelques heures s'il y a un lien depuis la page d'accueil et un sitemap, à moins d'avoir un grand nombre de nouvelles URL par jour. j'ai dit que la demande manuelle d'indexation doit rester exceptionnelle car vous avez mieux à faire de votre temps, c'est tout !
moi aussi je l'utilise de temps en temps, par exemple pour faire des tests (et mesurer l'impact en sachant à quelle date précise Google a réindexé la page concernée).
Bonjour , j'ais remarquer que google index pas tout les url fourni via le fichier Sitemap pourtant en voyant le nombre de résultat de recherche google lorsque je fait site:monsite.fr je voie mes 200 url dans le fichier sitemap j'en voie que 100 pourtant mes url apparaisses bien sur google est-ce normal ?
la commande site: n'est pas toujours très fiable, et les données de Search Console pas forcément à jour. Par ailleurs, il peut y avoir des pages indexées qui ne sont pas dans le sitemap.
la plupart des sitemap XML sont faux. L'une des valeurs ajoutées du SEO est de les vérifier ^^
La plupart, c'est un peu exagéré. Mais en effet, il faut régulièrement les vérifier.
Les nouvelles pages de Mon site (assurance-conseil.com) ne sont indexées qu'au bout de 5-6 jours. Ceci Est-il normal ?
Non ce n'est pas normal, sauf quand le site n'a aucune popularité (c'est peut-être le cas)
Bonjour, chez moi c'est un problème de sur indexation. J'ai le double de page indexé Google (plus de 500 au lieu de 200 ^^). Une idée ? ☺
@ric : là aussi il y a plein de raisons possibles, faudrait que j'écrive un autre article ! Le sitemap n'est peut-être pas exhaustif ?
Je comprends mieux pourquoi sur google tool un de mes blogs (actuduweb.fr) n'avait pas toutes les pages d'indexées ! Merci pour le dossier !
ok merci ;) par contre je pensais a une solution automatisée pour un domaine comprenant environ 3000 pages à indexées. Comment interrogé Google sans se faire bloquer ? n'existe t il pas de script ou d'outil disponible ?
Existe t il une solution pour checker et donc sortir la listes des urls non indexées pour un domaine ?
@rom1 : oui mais il faut interroger Google à coup de nombreuses requêtes sans se faire bloquer