Pages non indexées avec redirection GSC

webmestre amateur · 11 Février 2025

Bonjour à tous,
Je reçois régulièrement des alertes dans GSC concernant certaines pages web du site non indexées.
J'ai par exemple 232 pages non indexées avec redirection.
La 1/2 moitié concerne des pages en http qui sont passées depuis au moins 3 ans en https. Mais google continue à les crawler.
Ex dans la GSC :
1) http://www.pepiniere-courtin.fr/realisations/bassins-de-jardin/ et la même en https : https://www.pepiniere-courtin.fr/realisations/bassins-de-jardin/
ou
un autre exemple :
http://www.pepiniere-courtin.fr/catalogue/rosiers/rosiers-buissons et la même en https : https://www.pepiniere-courtin.fr/catalogue/rosiers/rosiers-buissons

Que faire pour enlever ces pages en http (si on peut le faire bien sûr) ?

Merci.
Cordialement,

pomination · 11 Février 2025

Bonjour,
De quand date la mise en place de la redirection http --> https ?

cleatis · 12 Février 2025

Tentez de forcer l'indexation par Google via la GSC de ces nouvelles URL
Travaillez le netlinking interne de ces pages
Si ces pages bénéficient de backlinks, tentez de mettre à jour les URL de ces liens.

webmestre amateur · 12 Février 2025

Bonjour à tous,

Pour répondre à pomination, ce n'est pas une redirection http vers https mais une migration du site. Malheureusement je n'ai pas pensé à noter la date de la migration. MAis il y a au moins 3 ans ou peut-être 4 ans maintenant.

cleatis a dit:
Tentez de forcer l'indexation par Google via la GSC de ces nouvelles URL

Qu'entendez-vous par nouvelles URL ? Ce sont celles en https ?

Merci.

cleatis · 12 Février 2025

Les nouvelles pour moi, oui, c'était celles en https.

Ces anciennes URL sont certes encore positionnées, mais génèrent-elles encore des visites ?

webmestre amateur · 12 Février 2025

Ok. Je vais tenter de forcer google. On verra bien.

pomination · 12 Février 2025

Qu'est-ce qu'on entend par migration ? parce que c'est le même nom de domaine..
Changement d'hébergeur ? Pour Google c'est transparent. Ce qui ne l'est pas c'est le changement de protocole.
Je pense donc qu'une simple validation des corrections devrait résoudre cela.

Elle sont classées dans quelle anomalie ces pages en http ? Dans "Pages avec redirection" ?

webmestre amateur · 12 Février 2025

pomination a dit:
pomination a dit:

Elle sont classées dans quelle anomalie ces pages en http ? Dans "Pages avec redirection" ?

Cliquez pour agrandir...

Oui, c'est bien cela : elles se trouvent dans Pages avec Redirection.

pomination · 12 Février 2025

En utilisant l'inspection d'URL (la loupe) sur une de ces pages, quelle est la source (page d'origine) ?

webmestre amateur · 12 Février 2025

Oui, par exemple pour la page https://www.pepiniere-courtin.fr/arrivage-de-plants-de-boisement/, j'obtiens les renseignements sur la copie d'écran ci-jointe.

webmestre amateur · 12 Février 2025

En analysant la page https://www.pepiniere-courtin.fr/plants-de-boisement/ , je viens de voir que dans l'encart Page d'origine, la seconde page citée n'existe plus : https://www.pepiniere-courtin.fr/nos-realisations/abattage-elagage

Un lien en rapport avec la redirection ?

pomination · 12 Février 2025

On s'est mal compris. L'inspection d'URL il faut l'utiliser sur une des pages qui est dans "Pages avec redirection", et donc, a priori, qui commence par http://

pomination · 12 Février 2025

Mais, prenons cet exemple : https://www.pepiniere-courtin.fr/arrivage-de-plants-de-boisement/
Cette URL est en effet redirigée vers : https://www.pepiniere-courtin.fr/plants-de-boisement/

Si on regarde le code sources des pages supposées d'origine, on constate que c'est bien la seconde URL qui est appelée. Pourtant, par le passé, cette URL devait être connue sous le nom de la première.

C'est pour ça que j'utiliserais "Valider la correction" : Google va faire le ménage dans cette section "Pages avec redirections" en enlevant celles pour lesquelles ce n'est plus le cas.

webmestre amateur · 13 Février 2025

Bonjour,
Dans l'exemple que tu cites juste au-dessus, ce sont 2 pages différentes.
https://www.pepiniere-courtin.fr/arrivage-de-plants-de-boisement/ est un article de la rubrique actualités alors que la page https://www.pepiniere-courtin.fr/plants-de-boisement/ est une page produit.

webmestre amateur · 13 Février 2025

En explorant une page http, cela donne ceci :

Comme je pense devoir demander pour presque chaque ligne http avec un motif différent, je voudrais savoir si je peux éviter d'ajouter de nombreuses copies d'écran, ceci afin d'éviter de surcharger le serveur de documents joints en copie d'écran.
Est-ce qu'il y aurait juste une seule ligne à recopier afin d'alléger cette discussion ?
Merci.

cthierry · 13 Février 2025

webmestre amateur a dit:
Bonjour,
Dans l'exemple que tu cites juste au-dessus, ce sont 2 pages différentes.
https://www.pepiniere-courtin.fr/arrivage-de-plants-de-boisement/ est un article de la rubrique actualités alors que la page https://www.pepiniere-courtin.fr/plants-de-boisement/ est une page produit.

Et pourtant, la première redirige directement sur la seconde ce qui fait que c'est une seule et même page. Il y a du boulot, à commencer par ton sitemap qui est déclaré en HTTP. On sent une envie d'optimiser, mais... qui est partie dans tous les sens.

webmestre amateur · 13 Février 2025

cthierry a dit:
Il y a du boulot, à commencer par ton sitemap qui est déclaré en HTTP. On sent une envie d'optimiser, mais... qui est partie dans tous les sens.

Oui, il y a trop de pages non indexées avec des motifs différents.
Mais comment vois-tu que le sitemap est en http alors que j'ai tout passé en https ?

cthierry · 13 Février 2025

Le robots.txt est ton ami.

webmestre amateur · 13 Février 2025

On s'écarte un peu du thème des pages non indexées.

Oui, je viens de découvrir que robots.txt contient la ligne http://www.pepiniere-courtin.fr/sitemap_index.xml
Remarques ou bizarreries comme on veut :
1) Déjà, je n'y touche pas car par principe, j'évite de modifier les fichiers que je ne connais pas.
2) Ensuite, il renvoie vers un sitemap en http alors que tout le site est en https.

webmestre amateur · 13 Février 2025

De plus, je viens de voir à l'instant que le fichier sitemap_index.xml n'existe pas sur le site.

cthierry · 14 Février 2025

webmestre amateur a dit:
On s'écarte un peu du thème des pages non indexées.

D'où mon : Il y a du boulot, à commencer par ton sitemap qui est déclaré en HTTP. On sent une envie d'optimiser, mais... qui est partie dans tous les sens.

webmestre amateur · 14 Février 2025

Bonjour,

cthierry a dit:
D'où mon : Il y a du boulot, à commencer par ton sitemap qui est déclaré en HTTP.

Mais que faire pour les problèmes :
1) du sitemap_index.xml qui n'existe pas sur le site ?
2) transformer http en https alors que le site est déjà en https ?

Marie-Aude · 14 Février 2025

Bonjour, vérifie les paramétrages de SEO Key, pour ton sitemap en http. Et pour ton robots.txt, modifies-le. Cette ligne n'est pas arrivée là par hasard, mais via un plugin SEO qui a modifié le fichier.

webmestre amateur · 14 Février 2025

Merci Marie-Aude : tu m'as mis sur la bonne voie je pense.

Je viens de vérifier dans SeoKey : il n' y a pas de fichier sitemap_index.xml mais il est remplacé par 4 plans de site.
Il existe un plan de site XML qui est généré par SEOKEY qui est affiché en haut de la page web citée ci-dessous.

Ce fichier index plan de site XML contient 4 plans de site que l'on peut voir ici : https://www.pepiniere-courtin.fr/wp-content/uploads/seokey/sitemaps/sitemap-index-FRA.xml

Dois-je envoyer et soumettre à GSC les 4 sitemaps en question ?
Merci.

Marie-Aude · 15 Février 2025

Non, seul le site map principal. Google va explorer les autres tout seul comme un grand

webmestre amateur · 15 Février 2025

Ok.

Merci bien.

webmestre amateur · 16 Février 2025

Bonjour à tous,

cthierry a dit:
Il y a du boulot, à commencer par ton sitemap qui est déclaré en HTTP. On sent une envie d'optimiser, mais... qui est partie dans tous les sens.

J'ai donc repris mes investigations sur les pages non indexées en redirection.
Je viens de voir plusieurs détails pour une page en particulier qui m'intriguent :
1) cette page étrange dans la liste des pages indiquées par GSC : https://www.pepiniere-courtin.fr/catalogue/arbres-f
L'url est tronquée par quoi, par qui ?
La véritable url, c'est celle-ci : https://www.pepiniere-courtin.fr/catalogue/arbres-fruitiers/
2) l'url de la page d'origine est frelatée : elle appartient à un site douteux.
Cela sent le piratage du site ?
Je le surveille tous les jours et j'ai installé il y a sans doute plusieurs années maintenant wordfence. Je reçois les alertes de log par les escrocs de tous poils qui veulent se connecter en admin (ou autre pseudo). Ce sont toutes des alertes en échec.
3) Sans avoir créé de redirection pour cette page, le site envoie bien sur https://www.pepiniere-courtin.fr/catalogue/arbres-fruitiers/

Je vous joins une copie d'écran pour avoir toutes les infos nécessaires.

Merci.

pomination · 17 Février 2025

C'est parce que le site en question cite bien le site, mais il y a un espace dans l'URL :

webmestre amateur · 17 Février 2025

Bonjour à tous,

pomination a dit:
C'est parce que le site en question cite bien le site, mais il y a un espace dans l'URL :

Je ne remet pas en cause ce que vous dites mais je ne vois pas le mot games mais plutôt james. De plus, je ne vois pas d'espace dans l'url.
Comment voyez-vous tout cela ?
De plus, comment faites-vous pour afficher le bas de la page avec les mots clés en surbrillance ?
Cela m'aiderait à être plus perspicace et peut-être à découvrir des détails importants.
Merci.

Marie-Aude · 17 Février 2025

ça répondait à la question "L'url est tronquée par quoi, par qui ?" et l'espace est au dessus du vert

webmestre amateur · 17 Février 2025

Ok. Merci pour l'explication.
Mais j'ai encore 2 autres questions :
Je viens de regarder cette page suspecte. en effet, plus bas, dans la page, on peut lire le lien https://www.pepiniere-courtin.fr/catalogue/arbres-f ruitiers/pommiers/
Quel intérêt pour un site de citer mon site en question qui n'a vraiment aucun rapport avec notre activité ?
De plus, google sans doute doit nous pénaliser d'avoir un backlink pareil, qui renvoie vers notre site ?

webmestre amateur · 19 Février 2025

Bonsoir à tous,
Ce soir en continuant mon travail de fourmi, GSC m'affiche une erreur : "Impossible d'atteindre robots.txt".
Pourtant, dans la journée, j'ai lancé des tests et GSC avait pu atteindre robots.txt.
J'ai vérifié sur plusieurs pages et j'obtiens à chaque fois cette erreur.
Je revérifierai demain pour savoir si cela est dû à un problème de serveur.
Merci.

pomination · 19 Février 2025

Probablement un souci temporaire d'accès
A vérifier dans les stats d'exploration de GSC s'il y a des indisponibilités du site constatées

webmestre amateur · 20 Février 2025

Bonjour,
Effectivement, c'était un problème des serveurs chez l'hébergeur.
Cela refonctionne à nouveau.

pomination a dit:
A vérifier dans les stats d'exploration de GSC s'il y a des indisponibilités du site constatées

Où peut-on voir cela car j'ai regardé mais je n'ai pas trouvé

pomination · 21 Février 2025

Dans GSC, aller dans "Paramètres" en bas à gauche, puis, à droite, "Statistiques sur l''exploration". Là il y aura un bouton "Etat de l'hôte"

webmestre amateur · 21 Février 2025

Bonsoir,
Je viens de regarder.
GSC affiche :

exploration par le fichier robots.txt : Taux d'échec acceptable (coché vert)
résolution DNS : Taux d'échec acceptable (coché vert)
connectivité au serveur : Taux d'échec acceptable récemment, mais élevé précédemment (coche verte mais fine).

pomination · 22 Février 2025

En cliquant sur "connectivité du serveur" on peut voir à quelle(s) date(s) il y a eu des défauts de réponse.
Soit maintenance chez l'hébergeur, soit serveur un peu juste et qui est parfois coulé.

webmestre amateur · 22 Février 2025

Depuis le 24/11, 2 journées qui ont posé problème dont le 29/01 à 50 % et le 19/02 à 33 %.
Le reste du temps, aucune erreur.
Sur pratiquement 3 mois, cela ne fait que ces 2 erreurs là. Peut-être de la maintenance.

Pages non indexées avec redirection GSC

Fichiers joints

Fichiers joints

Fichiers joints

Fichiers joints