Dégringolade dans google et référencement de pages inexistantes

WRInaute discret
Bonjour à tous,

Je rencontre de grosses difficultés depuis quelques semaines avec le référencement d'un site qui était pourtant toujours en première page des recherches Google depuis plusieurs années alors que ce site n'a fait (selon moi) que s'améliorer et rendre le contenu plus lisible.

Ce site (arcskilocation.com) créé en 2009 propose du matériel de ski à la location et l'accent à été mis dans les titres de pages, les métas et le contenu sur ce thème.
Nous étions donc toujours en première page lors de recherche du type "location skis arcs 1600" or maintenant on ne nous retrouve plus qu'à partir de la 10ème page et parfois avec des url qui n'existent plus depuis 3 ans voire qui n'ont jamais existé...

quand je fais une recherche avec site:arcskilocation.com, je trouve par exemple : arcskilocation.com/iframes/images/atelier-reparation-ski-snowboard-les-arcs-1600.php
Or cette page n'a jamais existé, il y avait bien un repertoire iframes il y a 3 ans mais j'ai rapidement supprimé ce repertoire ainsi que toute utilisation d'iframe sur le site.

Plus troublant encore il semble que nous soyons toujours très bien placé dès que l'on introduit un autre mot dans la requête Google, par exemple : "location skis fats arcs 1600" ou "location skis femmes arcs 1600" donne de très bons résultats, dumoins sur mon poste de travail, même quand je ne suis pas connecté à mon compte Google, mais là aussi les résultats semblent varier en fonction de l'utilisateur...
Pourquoi Google nous refuse-t-il subitement le statut de loueur de skis ?

J'ai récement mis en place un système de ré-ecriture d'url pour augmenter la visibilité auprès des moteurs de recherche tout en restant objectif, lorsque l'on navigue sur le site les url s'écrivent sous la forme :
arcskilocation.com/les-arcs-1600/location/skis/hommes/location-skis-0.html

Le sitemap contient toutes les url accessibles sur le site (voir /sitemap.xml) et elles sont toutes validées dans les outils Google pour les webmasters.

Mes 2 problèmes sont donc :

- Voyez vous une raison de cette dégringolade lors d'une recherche sur le thème : "location skis arcs 1600".

- que faut-il faire pour toutes les pages référencées qui n'existent pas et peuvent provoquer l'abandon de la navigation par l'utilisateur.
J'ai essayé une redirection vers la page d'accueil en cas de page inexistante, mais cela n'a pas l'air de plaire à GG : duplicate content.

Je vais arreter là pour mes questions pour le moment dans l'attente de votre aide pour y voir un peu plus clair.

Merci d'avance pour vos réponses
 
WRInaute discret
Bonjour et merci de ta réponse,

Non, au mois de septembre je n'ai rien fait sur les redirection...

Nous nous somme aperçu de problèmes sur le site en octobre et je pense que c'est plutôt début novembre que j'ai fait cette erreur qui n'est restée en ligne que 2 ou 3 jours...

Google a immédiatement mis à jour toutes les descriptions et m'a signalé du duplicate content dans les métas descriptions, c'est pourquoi je me suis tout de suite dit que c'était une erreur...

Les pages inexistantes sont bien depuis en erreur 404 et j'ai personnalisé un peu cette page ce matin pour informer les éventuels utilisateurs.
j'ai vérifié dans les outils pour les webmaters que Apache renvoie bien le code 404 et tout à l'air ok.
 
WRInaute passionné
Moi, j'aurai utilisé la 410 pour les pages qu'il a découvert.

404 c'est lorsqu'on pointe via un lien sur une page qui n'existe pas.
Là, GG a pointé sur une page pour laquelle il a eu, même temporairement, un résulat, et donc un code 200. Aussi, lui indiquer une 410 (page définitivement supprimer) me semble plus adéquate.
 
WRInaute discret
Et bien à vrai dire moi je ne fais rien qui indique qu'il s'agit d'une erreur 404...

Je suis sur un hébergement mutualisé et je pense que c'est le serveur Apache qui décide du code d'erreur à renvoyer non ?

Je remarque quand même que la ligne concernant la redirection 410 est commentée dans le htaccess, est-ce que le fait de la décommenter modifiera le comportement du serveur Apache ?

Autre chose à signaler, j'ai fait des tests de recherche avec Bing et Yahoo comme moteur de recherche, et là on sort systématiquement en première page...
Mais c'est toujours depuis mon poste de travail, donc un peu sujet à caution.
Si quelques uns d'entre vous veulent bien faire le test avec la requête "location skis arcs 1600" dans ces moteurs et me dire si c'est pareil pour eux, je les en remercie d'avance :-)

Concernant Google ce qui m'étonne un peu aussi c'est que même avec cette requête, les premiers résultats qui apparaissent font référence aux pages "location de snowboard" ou encore "location de boots de snowboard" du site, mais pas au pages réelement typées "skis".
Si ça vous donne des idées, faites m'en part :-)
 
WRInaute passionné
Bonjour Alex,

désolé de ce qui t'arrive. J'ai contrôlé de mon mac avec Safari et localisé a Paris, sur cette requete "location skis arcs 1600 ", tu apparait en 5ème page, et fin de page ... Pas glop si c'est ta requete la plus importante.

Pour ce qui est des pages "fantomes" indexées, tu n'es pas le seul. Peu à peu, le nombre d'abonnés au bug de Google augmente.
Pour ma part, ce sont des dizaines de milliers de pages "fantômes" que je retrouve dans les serps, et plus grave, ce sont des pages très anciennes qui ne correspondent pas au département (marseille dans le dept 69 etc ...). Non seulement il est impossible de contacter un quelconque service technique chez Google, mais sur leur forum, les employés de Google cherchent a tout prix de trouver le moyen de te dire que l'erreur viens de chez toi, et que ce n'est pas grave, même si ton trafic baisse, à toi de faire mieux ... ben voyons ... depuis le mois de Mai, je me bat avec ce soucis.

Moi j'ai trop de redirections a faire (k 5 millions de pages), donc, mon seul remède, c'est de changer mon architecture, ce qui est en cours. Si tu n'a pas trop de pages, gère les redirections individuellement et ca devrait rentrer dans l'ordre.
 
WRInaute discret
Bonsoir,

Merci de ta réponse et d'avoir pris le temps de faire ce petit test :-)

C'est avec Google ou Bing et Yahoo que tu as fait ce test ?
Si c'est avec Google c'est que nous sommes déjà remonté d'une page, si c'est avec Bing c'est que l'on ne peut même pas s'appuyer sur les résultats obtenus sur son propre poste de travail (même hors connexion à un quelconque compte) pour savoir comment on se situe...

Concernant les pages "fantomes" je suis en train de regarder si je peux faire en sorte que certaines requêtes renvoient le code 410 en utilisant le htaccess.
Je ne peux pas les traiter une par une mais je pense que je peux déjà en supprimer beaucoup en me servant du "path" de l'url.
En effet, je retrouve des points communs dans la plupart des url (comme iframes ou video).
Je devrais donc pouvoir utiliser des expressions régulières pour les cibler et générer une erreur 410.

Toutes vos réflexions sur ce procédé seront les bienvenues ;-)

Ha oui j'oubliais, j'ai un peu peur du procédé de l'erreur 410 car après ça veut dire que je ne pourrais plus jamais utiliser "video" dans mes "path", est-ce exact ?
 
WRInaute discret
Merci

Quelque part ça me rassure ce que tu me dis là parce que nous avions quasiment disparu de Google et que l'on commence à réapparaître.
Ça semble vouloir dire que les efforts fait même récemment ne sont pas inutiles.

Je vais faire en sorte de désindexer les pages fantômes et je crois qu'après le plus urgent c'est d'attendre.
 
WRInaute passionné
Mutualisé ou dédié, c'est à toi de gérer correctement les code d'erreur.

Apache n'envoi rien d'autre que ce qu'on lui dit.
A la base il est configuré pour quelques modes (en simplifiant) la 200 si tout est ok et la 404 si la page n'est pas trouvé.
C'est a toi via le htaccess de lui dire que toute cette liste de pages doit retourner un code 410.
 
WRInaute discret
Merci de ta réponse,

Oui oui j'ai creusé un peu pour faire ça proprement et j'ai ajouté ceci à mon htaccess :

Code:
RedirectMatch gone "/(video|iframe|iframes|galerie)/?(.+)?"

J'ai cherché un peu car "redirect" ne fonctionne pas avec les regex, il faut donc utiliser "redirectMatch".
Cela semble fonctionner correctement, j'ai quand même fait un test avec les outils Google pour les webmasters dans "Explorer comme Google" en soumettant l'url suivante :
video/images/commun/location/images/newsletter-arcskilocation.php

qui est l'une des url indexées par Google et j'obtiens le résultat suivant :

HTTP/1.1 410 Gone
Date: Wed, 13 Nov 2013 17:48:55 GMT
Server: Apache
Set-Cookie: PHPSESSID=ed18c823a94b724cee64bd474babb4ec; path=/
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Content-Length: 4083
Keep-Alive: timeout=5
Connection: Keep-Alive
Content-Type: text/html

Ce qui à l'air de correspondre à mes souhait en renvoyant l'erreur 410 pour toutes les URL contenant video ou iframe ou iframes ou galerie.
Les autres pages erronées étant toujours en erreur 404.

Merci pour votre aide à tous
 
Discussions similaires
Haut