Mes pages rubriques ne se réindexent pas

Nouveau WRInaute
Bonjour à tous,

Je m'occupe du référencement d'un site important.
Suite à des erreurs de programmation, les pages rubriques (une douzaine) sont restées plusieurs semaines en noindex, nofollow. :(

Du coup, Google a fait son boulot et desindexé les pages rubriques, qui étaient PR3.
Restaient indexées la home (PR4) et les pages articles (PR2).
M'en étant aperçu, j'ai fait remettre en ordre les balises robots depuis un mois et demi et resoumis le sitemap.

Depuis, Google n'a toujours pas remis les pages rubriques dans son index (alors que des milliers de pages sont crawlées chaque jour). 8O

Quelqu'un a-t-il une solution pour que Google réindexe mes pages rubriques ?

Merci par avance
JohnSilver
 
Membre Honoré
Vous pouvez préciser quel est votre site (tout public) pour que les membres puissent mieux vous aider.
Vous pouvez vérifier si vous avez des informations ou modifications concernant le crawl avec GWT.
 
Membre Honoré
Votre fichier robots précise "Disallow: /*?PHPSESSID*" semble inutile.
Les pages de catégories sont bien indexées mais avec les sessions.
Autant ne pas affichées les sessions (et une redirection des pages indexées en duplicate content). :?

Merci à vous pour votre participation sur le forum en répondant aussi à d'autres topics ou remerciant les membres (lien).
C'est ce qui motive les membres et permet d'avoir un forum qui permet de faire évoluer les sites tous les jours.
 
Nouveau WRInaute
Merci pour la réponse, mais je n'ai pas tout capté.

Madrileño a dit:
Votre fichier robots précise "Disallow: /*?PHPSESSID*" semble inutile
En fait, il ne l'est pas, car les identifiants de session, qui servent à gérer la newsletter et le panier de la boutique, ne sont pas correctement gérés.
En attendant de pouvoir faire corriger, j'ai ajouté cette ligne pour éviter les duplicate, introuvables & co par milliers (les notations en généraient aussi, d'où la ligne excluant les db.php). Tout ça date d'avant mon arrivée.
Madrileño a dit:
Les pages de catégories sont bien indexées mais avec les sessions.
Comment fait-on pour voir cela ? J'utilise la commande site: mais ne vois rien de tel. Ni dans le sitemap soumis. :?:
Madrileño a dit:
Autant ne pas affichées les sessions (et une redirection des pages indexées en duplicate content).
Si on n'affiche pas les sessions, on ne peut pas les utiliser, non ? Et il est hors de question de fonctionner par cookies.

Madrileño a dit:
Merci à vous pour votre participation sur le forum en répondant aussi à d'autres topics ou remerciant les membres (lien).
C'est une demande générale, je suppose ? :) (remarque : j'ai dû participer à une demi-douzaine de fils, dans 50% des cas au moins pour aider).

Cordialement
JohnSilver
 
Membre Honoré
JohnSilver a dit:
Madrileño a dit:
Les pages de catégories sont bien indexées mais avec les sessions.
Comment fait-on pour voir cela ? J'utilise la commande site: mais ne vois rien de tel. Ni dans le sitemap soumis. :?:
Simple recherche Google pour vérifier.
JohnSilver a dit:
Madrileño a dit:
Autant ne pas affichées les sessions (et une redirection des pages indexées en duplicate content).
Si on n'affiche pas les sessions, on ne peut pas les utiliser, non ? Et il est hors de question de fonctionner par cookies.
C'est vous le webmaster. :)
JohnSilver a dit:
C'est une demande générale, je suppose ? :) (remarque : j'ai dû participer à une demi-douzaine de fils, dans 50% des cas au moins pour aider
C'est déjà mieux que rien. :mrgreen:
 
Nouveau WRInaute
Madrileño a dit:
Simple recherche Google pour vérifier.
Euh ... ma question c'est : laquelle (quelle syntaxe) exactement.

(nb : il y aura un bien un p'tit lien si ça répond à mon problème, mais pas depuis le site de mon client ...)

JohnSilver
 
Nouveau WRInaute
Bon, en regardant de plus près site:http://www.toutpratique.com/3-Organiser/
et en incluant les résultats ignorés, on trouve cette url affublée d'un identifiant de session
(je suppose que c'est ce que voulait indiquer Madrileño comme manip).

Donc, si je comprends bien :
- ce résultat part dans la partie reculée de l'index puisqu'il porte un phpsessid et que je demande à Google de ne pas indexer les url qui en portent un (robots.txt)
- quand il va sur la page avec l'url sans le session id, il considère qu'il la connaît déjà, puisqu'il a celle avec le sessid.

Autrement dit, comme je ne peux pas modifier le robots.txt, si je veux qu'il réindexe mes pages sans sessid, il faut que je redirige par .htaccess les url indexées actuellement avec le sessid vers les url sans sessid et tout devrait rentrer dans l'ordre (je suppose qu'il n'applique le robots.txt qu'à l'url redirigée).
Et dans quelques semaines, je supprime les redirections 301.

C'est ça ?

JS
 
WRInaute passionné
Ne bloque pas cela par robots.txt, tu risques d'empêcher Google de visiter ces pages (ça m'est arrivé)

Met ce paramètre de sessions sur "Ignorer" dans GWT > Paramètres pour signifier à Google qu'il ne doit pas en tenir compte

Tu peux également ajouter la balise rel="canonical" avec l'url de la page en question sans ID de session
 
Membre Honoré
JohnSilver a dit:
(je suppose que c'est ce que voulait indiquer Madrileño comme manip).
C'est pareil. Possible duplicate content et il faut préciser à Google l'url à indexer.
lambi521 a dit:
Met ce paramètre de sessions sur "Ignorer" dans GWT > Paramètres pour signifier à Google qu'il ne doit pas en tenir compte
Il y a aussi les autres moteurs.
lambi521 a dit:
Tu peux également ajouter la balise rel="canonical" avec l'url de la page en question sans ID de session
C'est le mieux.
 
Nouveau WRInaute
Merci lambi521.

Bonne idée.

Pour les paramètres de GWT, ils sont déjà sur "ignorer" pour les pages avec sessid.
Je vais faire mettre des canonical dans les header asap et faire des redirections 301 pour les pages déjà indexées.

A priori, le topic me semble résolu.

A+
JohnSilver
 
Discussions similaires
Haut