Pages non indexées avec redirection GSC

WRInaute discret
Bonjour à tous,
Je reçois régulièrement des alertes dans GSC concernant certaines pages web du site non indexées.
J'ai par exemple 232 pages non indexées avec redirection.
La 1/2 moitié concerne des pages en http qui sont passées depuis au moins 3 ans en https. Mais google continue à les crawler.
Ex dans la GSC :
1) http://www.pepiniere-courtin.fr/realisations/bassins-de-jardin/ et la même en https : https://www.pepiniere-courtin.fr/realisations/bassins-de-jardin/
ou
un autre exemple :
http://www.pepiniere-courtin.fr/catalogue/rosiers/rosiers-buissons et la même en https : https://www.pepiniere-courtin.fr/catalogue/rosiers/rosiers-buissons

Que faire pour enlever ces pages en http (si on peut le faire bien sûr) ?

Merci.
Cordialement,
 
WRInaute discret
  • Tentez de forcer l'indexation par Google via la GSC de ces nouvelles URL
  • Travaillez le netlinking interne de ces pages
  • Si ces pages bénéficient de backlinks, tentez de mettre à jour les URL de ces liens.
 
WRInaute discret
Bonjour à tous,

Pour répondre à pomination, ce n'est pas une redirection http vers https mais une migration du site. Malheureusement je n'ai pas pensé à noter la date de la migration. MAis il y a au moins 3 ans ou peut-être 4 ans maintenant.
Tentez de forcer l'indexation par Google via la GSC de ces nouvelles URL
Qu'entendez-vous par nouvelles URL ? Ce sont celles en https ?

Merci.
 
WRInaute discret
Les nouvelles pour moi, oui, c'était celles en https.

Ces anciennes URL sont certes encore positionnées, mais génèrent-elles encore des visites ?
 
WRInaute occasionnel
Qu'est-ce qu'on entend par migration ? parce que c'est le même nom de domaine..
Changement d'hébergeur ? Pour Google c'est transparent. Ce qui ne l'est pas c'est le changement de protocole.
Je pense donc qu'une simple validation des corrections devrait résoudre cela.

Elle sont classées dans quelle anomalie ces pages en http ? Dans "Pages avec redirection" ?
 
WRInaute occasionnel
On s'est mal compris. L'inspection d'URL il faut l'utiliser sur une des pages qui est dans "Pages avec redirection", et donc, a priori, qui commence par http://
 
WRInaute occasionnel
Mais, prenons cet exemple : https://www.pepiniere-courtin.fr/arrivage-de-plants-de-boisement/
Cette URL est en effet redirigée vers : https://www.pepiniere-courtin.fr/plants-de-boisement/

Si on regarde le code sources des pages supposées d'origine, on constate que c'est bien la seconde URL qui est appelée. Pourtant, par le passé, cette URL devait être connue sous le nom de la première.

C'est pour ça que j'utiliserais "Valider la correction" : Google va faire le ménage dans cette section "Pages avec redirections" en enlevant celles pour lesquelles ce n'est plus le cas.
 
WRInaute discret
En explorant une page http, cela donne ceci :

Comme je pense devoir demander pour presque chaque ligne http avec un motif différent, je voudrais savoir si je peux éviter d'ajouter de nombreuses copies d'écran, ceci afin d'éviter de surcharger le serveur de documents joints en copie d'écran.
Est-ce qu'il y aurait juste une seule ligne à recopier afin d'alléger cette discussion ?
Merci.
 

Fichiers joints

  • Source page http explorée.jpg
    Source page http explorée.jpg
    66.2 KB · Affichages: 3
WRInaute accro
Bonjour,
Dans l'exemple que tu cites juste au-dessus, ce sont 2 pages différentes.
https://www.pepiniere-courtin.fr/arrivage-de-plants-de-boisement/ est un article de la rubrique actualités alors que la page https://www.pepiniere-courtin.fr/plants-de-boisement/ est une page produit.
Et pourtant, la première redirige directement sur la seconde ce qui fait que c'est une seule et même page. Il y a du boulot, à commencer par ton sitemap qui est déclaré en HTTP. On sent une envie d'optimiser, mais... qui est partie dans tous les sens.
 
WRInaute accro
Bonjour, vérifie les paramétrages de SEO Key, pour ton sitemap en http. Et pour ton robots.txt, modifies-le. Cette ligne n'est pas arrivée là par hasard, mais via un plugin SEO qui a modifié le fichier.
 
WRInaute discret
Merci Marie-Aude : tu m'as mis sur la bonne voie je pense. ;)
Je viens de vérifier dans SeoKey : il n' y a pas de fichier sitemap_index.xml mais il est remplacé par 4 plans de site.
Il existe un plan de site XML qui est généré par SEOKEY qui est affiché en haut de la page web citée ci-dessous.

Ce fichier index plan de site XML contient 4 plans de site que l'on peut voir ici : https://www.pepiniere-courtin.fr/wp-content/uploads/seokey/sitemaps/sitemap-index-FRA.xml

Dois-je envoyer et soumettre à GSC les 4 sitemaps en question ?
Merci.
 
WRInaute discret
Bonjour à tous,

Il y a du boulot, à commencer par ton sitemap qui est déclaré en HTTP. On sent une envie d'optimiser, mais... qui est partie dans tous les sens.
J'ai donc repris mes investigations sur les pages non indexées en redirection.
Je viens de voir plusieurs détails pour une page en particulier qui m'intriguent :
1) cette page étrange dans la liste des pages indiquées par GSC : https://www.pepiniere-courtin.fr/catalogue/arbres-f
L'url est tronquée par quoi, par qui ?
La véritable url, c'est celle-ci : https://www.pepiniere-courtin.fr/catalogue/arbres-fruitiers/
2) l'url de la page d'origine est frelatée : elle appartient à un site douteux.
Cela sent le piratage du site ?
Je le surveille tous les jours et j'ai installé il y a sans doute plusieurs années maintenant wordfence. Je reçois les alertes de log par les escrocs de tous poils qui veulent se connecter en admin (ou autre pseudo). Ce sont toutes des alertes en échec.
3) Sans avoir créé de redirection pour cette page, le site envoie bien sur https://www.pepiniere-courtin.fr/catalogue/arbres-fruitiers/

Je vous joins une copie d'écran pour avoir toutes les infos nécessaires.

Merci.
 

Fichiers joints

  • Page origine douteuse.jpg
    Page origine douteuse.jpg
    66.8 KB · Affichages: 7
WRInaute discret
Bonjour à tous,

C'est parce que le site en question cite bien le site, mais il y a un espace dans l'URL :
1739750606884.png

Je ne remet pas en cause ce que vous dites mais je ne vois pas le mot games mais plutôt james. De plus, je ne vois pas d'espace dans l'url.
Comment voyez-vous tout cela ?
De plus, comment faites-vous pour afficher le bas de la page avec les mots clés en surbrillance ?
Cela m'aiderait à être plus perspicace et peut-être à découvrir des détails importants.
Merci.
 
WRInaute accro
ça répondait à la question "L'url est tronquée par quoi, par qui ?" et l'espace est au dessus du vert
 
Dernière édition:
WRInaute discret
Ok. Merci pour l'explication.
Mais j'ai encore 2 autres questions :
Je viens de regarder cette page suspecte. en effet, plus bas, dans la page, on peut lire le lien https://www.pepiniere-courtin.fr/catalogue/arbres-f ruitiers/pommiers/
Quel intérêt pour un site de citer mon site en question qui n'a vraiment aucun rapport avec notre activité ?
De plus, google sans doute doit nous pénaliser d'avoir un backlink pareil, qui renvoie vers notre site ?
 
WRInaute discret
Bonsoir à tous,
Ce soir en continuant mon travail de fourmi, GSC m'affiche une erreur : "Impossible d'atteindre robots.txt".
Pourtant, dans la journée, j'ai lancé des tests et GSC avait pu atteindre robots.txt.
J'ai vérifié sur plusieurs pages et j'obtiens à chaque fois cette erreur.
Je revérifierai demain pour savoir si cela est dû à un problème de serveur.
Merci.
 

Fichiers joints

  • Erreur pour atteindre robots.txt.jpg
    Erreur pour atteindre robots.txt.jpg
    69.8 KB · Affichages: 3
WRInaute occasionnel
Probablement un souci temporaire d'accès
A vérifier dans les stats d'exploration de GSC s'il y a des indisponibilités du site constatées
 
WRInaute occasionnel
Dans GSC, aller dans "Paramètres" en bas à gauche, puis, à droite, "Statistiques sur l''exploration". Là il y aura un bouton "Etat de l'hôte"
 
WRInaute discret
Bonsoir,
Je viens de regarder.
GSC affiche :
  • exploration par le fichier robots.txt : Taux d'échec acceptable (coché vert)
  • résolution DNS : Taux d'échec acceptable (coché vert)
  • connectivité au serveur : Taux d'échec acceptable récemment, mais élevé précédemment (coche verte mais fine).
 
WRInaute occasionnel
En cliquant sur "connectivité du serveur" on peut voir à quelle(s) date(s) il y a eu des défauts de réponse.
Soit maintenance chez l'hébergeur, soit serveur un peu juste et qui est parfois coulé.
 
WRInaute discret
Depuis le 24/11, 2 journées qui ont posé problème dont le 29/01 à 50 % et le 19/02 à 33 %.
Le reste du temps, aucune erreur.
Sur pratiquement 3 mois, cela ne fait que ces 2 erreurs là. Peut-être de la maintenance.
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut