Désindexation d'url de plugins (Jetpack) dans la search console.

  • Auteur de la discussion Auteur de la discussion Pach
  • Date de début Date de début
Nouveau WRInaute
Bonjour à tous,

J'ai un problème dans la search console, 655 url de plugins (jetpack) ont été indexées du jour au lendemain dans la search console et je n'arrive pas à les désindexer.

J'ai ajouté une balise noindex dans le fichier ht access pour désindexer toutes les url avec ce préfixe : wp-content/plugins/jetpack/

<IfModule mod_headers.c>
<FilesMatch "^wp-content/plugins/jetpack/.*">
Header set X-Robots-Tag "noindex, follow"
</FilesMatch>
</IfModule>

Pour vérifier si la balise noindex est visible par les robots des moteurs de recherche, j'ai utilisé plusieurs outils pour tester ces url.

Le problème est que quand je fais un test, l'en-tête X-Robots-Tag : noindex, follow n'apparait pas, et donc la search console ne veut pas désindexer toutes ces url.

Merci pour vos réponses.
 
WRInaute occasionnel
Bonsoir,

1 - faire un test pour voir si mod_headers est activé
Code:
<IfModule mod_headers.c>

Header set my-test-tag "test-mod-header"

</IfModule>

2 - si tu retrouves bien le header de test :

c'est ton regex qui ne fonctionne pas

3 - sinon :

Voir avec ton hebergeur, ou la config apache de ton serveur, mod_headers pas activé ?

Pour le test, une commande :

CSS:
curl -I https://domain.tld

Est bien plus simple et plus sûre.

Cordialement,

Eric

https://httpd.apache.org/docs/current/mod/mod_headers.html
https://httpd.apache.org/docs/2.4/fr/sections.html
 
Dernière édition:
Nouveau WRInaute
Bonsoir,

1 - faire un test pour voir si mod_headers est activé
Code:
<IfModule mod_headers.c>

Header set my-test-tag "test-mod-header"

</IfModule>

2 - si tu retrouves bien le header de test :

c'est ton regex qui ne fonctionne pas

3 - sinon :

Voir avec ton hebergeur, ou la config apache de ton serveur, mod_headers pas activé ?

Pour le test, une commande :

CSS:
curl -I https://domain.tld

Est bien plus simple et plus sûre.

Cordialement,

Eric

https://httpd.apache.org/docs/current/mod/mod_headers.html
https://httpd.apache.org/docs/2.4/fr/sections.html
Merci Eric !

C'était bien le mod_headers qui n'était pas activé sur le serveur.

Mais même avec le mod_headers activé, je n'avais toujours pas l'en-tête Noindex car le code ne fonctionnait pas.

Mais en remplaçant le code par celui-ci :

<IfModule mod_headers.c>
Header always set X-Robots-Tag "noindex, follow" "expr=%{REQUEST_URI} =~ m#^/wp-content/plugins/jetpack#"
</IfModule>

maintenant les URL apparaissent bien dans la search console avec l'en-tête noindex.

Ce qui me paraît étrange, c'est que quand je suis retourné dans le fichier ht.access pour copier le nouveau code et le partager sur le forum, ce nouveau code avait disparu comme si il avait été écrasé, je l'ai donc rentré à nouveau.

La search console n'a pas désindexé toutes les URL, mais une vingtaine ont déjà disparus des pages indexées de la search console, je pense qu'elle les désindexera petit à petit, enfin j'espère... car il en reste quand même encore 635.

Une seule URL : /wp-content/plugins/jetpack/jetpack_vendor/automattic/jetpack-connection/src/identity-crisis/_inc/admin.jsx (c'est la seule qui se termine par .jsx) indique : Indexée malgré le blocage par le fichier robots.txt.

Pourtant dans le robots.txt, la règle : Allow: /wp-content/plugins/jetpack/ est bien renseignée et autorise l'exploration et rend visible la balise noindex pour toutes les autres URL.

Je ne sais pas pourquoi toutes ces url de plugins sont apparues du jour au lendemain dans les pages indexées de la search console (alors qu'elles n'apparaissent pas comme indexées quand je tape le nom de mon site sur Google), mais j'ai remarqué une forte baisse de référencement depuis qu'elles sont dans les pages indexées de la search console. Et je pense que ces URL de plugins viennent diluer mes vraies pages qui ont un vrai contenu.

J'espère qu'elles seront rapidement toutes supprimées des pages indexées de la search console.
 
Nouveau WRInaute
et pour désindexer rapidement, demande dans Search Console la suppression de /wp-content/plugins/jetpack/
Oui, merci Olivier !

Après avoir réglé le problème côté serveur et rentré un code qui fonctionne dans le ht.access, j'ai immédiatement annulé la demande de suppression temporaire dans la search console qui n'avait eu aucun effet et j'en ai refait une pour toutes les URL qui contiennent le préfixe wp-content/plugins/jetpack/

J'espère que toutes ces actions suffiront à désindexer ces URL de plugins.
 
Nouveau WRInaute
Les url de plugins ont été indexées le 30 juin et la baisse de référencement a commencé le 27 juillet.
 
Olivier Duffez (admin)
Membre du personnel
je ne vois pas comment aider, on est quasi aveugles, avec très peu d'infos
ça donne quoi un site: incluant wp-content/plugins/jetpack/
 
Nouveau WRInaute
je ne vois pas comment aider, on est quasi aveugles, avec très peu d'infos
ça donne quoi un site: incluant wp-content/plugins/jetpack/
Je trouve étrange que depuis le début, mon site ait toujours eu le bon nombre de pages indexées (pages avec le contenu) et d'un coup, toutes ces url qui s'indexent et très longues à désindexer et je me demande si la baisse de référencement 20 jours après l'indexation de toutes ces url inutiles est liée.

Quelles infos supplémentaires fournir ?
 
Dernière édition:
Nouveau WRInaute
la réponse à ma dernière question par exemple

il ne faut pas regarder des chiffres globaux (d'indexation), il faut filtrer par sitemaps par exemple
Dans mon sitemap_index.xml, il y a juste les 36 pages qui sont censées être indexées.

Avant ce problème, le chiffre global d'indexation était égal au chiffre dans le sitemap_index.xml.

Si je sélectionne "toutes les pages envoyées", il y a 32 pages.

Pour vous tout est normal ?
 
Discussions similaires
Haut