Search Console Détectée, actuellement non indexée

Nouveau WRInaute
Bonjour,

Malgré mes demandes répétées, nombre de mes posts ne sont pas indexés par Google (certains le sont).

Ils ne sont pas bloqués par le robots.txt, je n'ai aucune action manuelle dans la section Sécurité et actions manuelles et je n'ai fait aucune demande de suppression d'url.

QvZoSe.png


Est-ce que quelqu'un sait à quoi peut être dû ce problème ?

Merci d'avance !
 
Nouveau WRInaute
Bonjour

effectivement Google semble utiliser une IA pour reporter ou non le crawl d'une page.
Etes vous certain que la qualité de la page est jugée dès qu'elle passe en "détectée, actuellement non indexée" ?

J'ai remarqué que mes pages de faible valeur passent généralement en "explorée actuellement non indexée".

Pour celles qui sont juste détectées, il semble que Google décide de venir la crawler quand bon lui semble : 2 semaines, 1 mois, 2 mois voire plus... et ce n'est qu'à ce moment qu'il jugera de sa qualité et de l'indexer ou non.

Du coup à cause de cette prédiction, comment faire pour que Google décide de crawler quand même rapidement la page et de ne pas reporter le crawl à une date ultérieure ?

Quand je regarde les logs, il y a une différence au niveau du googlebot qui crawl la page dans la but de l'indexer et celui qui vient juste la détecter...

Récemment j'ai posté un article vers le 11 août. La SC console a rapidement affiché "détectée actuellement non indexée" et "découverte via le sitemap". Ce n'est que le 1er septembre qu'elle a été crawlée et indexée. Elle s'est d'ailleurs positionnée immédiatement en 6ème place de requêtes qui font autour de 2000 recherches / mois.

Pourquoi considérer que la page sera de faible valeur et la crawler plus tard si c'est pour finalement la positionner correctement dès son crawl ? C'est un non sens
 
Olivier Duffez (admin)
Membre du personnel
car Google ne se base pas sur la page en question (qu'il ne connait pas, il ne l'a pas crawlée) mais sur les autres que le site a publiées auparavant.

c'est une question de qualité globale du site.
Google en parle depuis Panda (2011) mais les éditeurs de sites et SEO font comme s'ils ne savaient pas (car on leur demande un gros boulot).

Pour ma part, j'ai alerté de ce phénomène il y a 1 an environ, car ça avait pris de l'ampleur. C'est surtout depuis cet été que je vois plein de gens le réaliser.
 
Nouveau WRInaute
Merci pour la réponse !
Mais ce que je ne comprends toujours pas c'est pourquoi google positionnerait très bien certaines pages (top 5 sur des requêtes à +10 000 recherches) pour ensuite considérer que la qualité du site ne mérite pas un crawl plus rapide ?
Surtout, pourquoi certaines nouvelles URLs sont indexées en quelques heures et d'autres en plusieurs semaines ?
 
Olivier Duffez (admin)
Membre du personnel
pourquoi google positionnerait très bien certaines pages (top 5 sur des requêtes à +10 000 recherches) pour ensuite considérer que la qualité du site ne mérite pas un crawl plus rapide ?

peut-être à cause des autres pages du site, qui ne sont pas d'aussi bonne qualité ?
pourquoi certaines nouvelles URLs sont indexées en quelques heures et d'autres en plusieurs semaines ?
mystère ! c'est rageant je te l'accorde.
mais ce que j'ai constaté (analyse sur de très très nombreux sites), c'est une corrélation forte malgré tout entre la qualité et l'optimisation d'une page et le fait qu'elle soit indexée.
 
Nouveau WRInaute
merci pour les retours !

Cette histoire de crawl prédictif c'est effectivement pénible... Encore si Google crawlait rapidement pour la classer en "explorée mais non indexée" ça permettrait de faire tout de suite des modifications. Mais là on doit attendre plusieurs semaines avant d'avoir la "réponse"
 
Nouveau WRInaute
En fait ce qui m'étonne aussi c'est qu'en vérifiant les logs, quand je publie un nouvel article, le GoogleBot ne passe même pas sur la page. Il la classe directement en détectée (grâce au sitemap) mais non indexée.

Donc effectivement on reconnait bien là le fameux "délit de sale gueule" dont tu parles dans ton article. Il ne prend même pas la peine de venir voir la page pour vérifier ce qu'il en est vraiment.

Et à côté des spots de BL à 10 euros indexent les nouveaux articles rédigés off shore en quelques heures...

L'autre jour j'ai poussé un nouvel article avec un lien interne contextualisé depuis une page qui fait 400 visiteurs par jour et 1ère sur pas mal de mots clés. Il a mis 3 semaines à la crawler malgré ça :mad:
 
Nouveau WRInaute
Petite question WebRankInfo, sur ton article tu parles de solutions à court et long terme. Ca m'intéresse mais pour éviter de payer le tuto "pour rien", est-ce que la solution à court terme ou 1 ou quelques URLs concerne une quelconque API dont certains sites américains ont parlé à partir de 2019 ?
merci !

(désolé pour les 3 postes à la suite :) )
 
Olivier Duffez (admin)
Membre du personnel
non, je ne connais pas d'API mystérieuse qui règlerait ces problèmes... peux-tu nous dire de laquelle il s'agit ?
 
Discussions similaires
Haut