Problème d'indexation de mes pages (26 sur 176) après 3 mois

Nouveau WRInaute
Bonjour,

J'ai assez longtemps attendu avant de commencer à demander des avis autour de moi... l'heure est venu de faire appel à vous.

J'ai mis en place un site parlant du réseau Usenet et des Newsgroups afin de tester mes connaissances en référencement pour essayer, pourquoi pas, de me mettre à mon compte plus tard en tant que consultant en référencement.
Ce site est donc une sorte de "bac à sable" où j'ai fait ce que j'ai pu apprendre sur le réf.

Voici l'adresse : http://www.les-newsgroup.fr

J'ai créé beaucoup de contenus, j'ai beaucoup travaillé ce contenu pour qu'il soit lisible par les visiteurs ET par Google, j'ai travaillé beaucoup de points très importants pour faciliter l'exploration du site et l'appréciation du contenu par les moteurs de recherches.

Mais l'indexation dans les moteurs n'a jamais décollé.
Google, Bing ou Yahoo n'indexe pas la totalité de mon site.

Pourriez vous le consulter et me dire ce que vous en pensez d'une part et surtout me dire si vous avez une piste pour mon problème d'indexation.

PS : je pencherai pour un problème de nombre de liens sur chaque page; en effet je pense que presque chaque page du site est accessible via le menu principal (et ce menu apparaît avant le contenu principal de chaque page dans le code source)
 
WRInaute impliqué
là tu dois avoir un sérieux problème pour savoir le nombre de pages indexées :P
actuellment :
https://www.google.fr/#hl=fr&source...=f&aqi=&aql=&oq=&gs_rfai=&fp=9318dee58a9fc896
donne 150 résultats ... qui se résument à 25 quand on pousse un peu plus loin ....
et :
Il s'agit d'un instantané de la page telle qu'elle était affichée le 27 juil. 2010 12:10:45 GMT. La page actuelle peut avoir changé depuis cette date
donc ce n'est pas super nouveau ...
ton plan de site est loin de donner 150 liens ... ainsi que ton sitemap ...
bon, il y a la thématique peut-être aussi ...
les liens d'affiliation vers usenet (payants de plus ...)
login = pas accessible à tous ...
quasiment rien sur yahoo! ...
au niveau places:
avec "usenet" : google.fr:inconnu Yahoo.fr: 61 bing:inconnu
avec "telecharger sur usenet" : google: 22 Yahoo:4 bing:30
bon mais faut dire aussi que ton site est relativement récent (03/03/2010) donc ...
etc ....
 
Nouveau WRInaute
Merci pour ta réponse ...


là tu dois avoir un sérieux problème pour savoir le nombre de pages indexées :P

Et bien je me base sur le centre pour Webmasters de Google (24 pages indexées sur 74 contenues dans le Sitemap)

ton plan de site est loin de donner 150 liens ... ainsi que ton sitemap ...

Désolé mais là j'ai fait une erreur dans mon premier post ... mon site comporte 74 pages uniques accessibles aux visiteurs ... et toutes celles ci sont bien accessibles dans le sitemap. Après Google va crawler d'autres pages secondaires et inutiles issues des plugins Wordpress.

Le problème est toujours là et se résume à ça : mon sitemap comporte 74 URLS, et à ce jour, 3 mois après la mise en ligne du site, seules 24 URLs sont indexées par Google.

Auriez vous une idée sur ce qui pourrait bloquer l'indexation complète du site ?


Des pages aves des liens d'affiliation pourraient être refusé dans l'index Google ?

Les problèmes de positionnements sur 'Usenet" (entre autres) sont différents, et je voudrais les résoudre après ...
 
WRInaute impliqué
dans ce cas si google en affiche 176 et les réduit à 25, c'est là qu'est le problème ...
duplicate, redirections, que sais-je ?
tu connais mieux ton site et ton codage que moi :wink:
et les gwt doivent certainement t'en donner qq indications ?
 
Nouveau WRInaute
toujours le même problème d'indexation ... aucune évolution pour le moment.

2 sitemaps étaient jusque là fournit à Google par Wordpress (via un plugin) ... un normal et un gzippé.

J'ai retiré récemment le gzippé pour qu'il n'en reste qu'un ...

Quelqu'un aurait il une idée svp ?

Merci !
 
WRInaute discret
kalamity666 a dit:
toujours le même problème d'indexation ... aucune évolution pour le moment.

2 sitemaps étaient jusque là fournit à Google par Wordpress (via un plugin) ... un normal et un gzippé.

J'ai retiré récemment le gzippé pour qu'il n'en reste qu'un ...

Quelqu'un aurait il une idée svp ?

Merci !

Salut

j'ai un peu le meme probleme sur la plupart de mes sites sous J!

Est ce que tu as travaillé les backlink de ton site ? Je me demande si c'est pas ça qui bloque.
Pareil pour les meta données ?

Meric
 
Nouveau WRInaute
Merci Meric pour ta réponse.

les méta sont gérés par SeoTools je crois ,un plugin WP. De ce coté rien de particulier ...

Et par contre c'est vrai je suis qu'au début de la campagne de backlinking ... ca influencerait l'indexation ?
J'ai du mal à le croire ... pour moi ya pas de rapport ... qu'il m'indexe et me positionne mal je veux bien, mais qu'il ne m'indexe pas parce que je ne suis pas bien positionnable c'est moyen ...

Quelqu'un a un retour sur ça ?
 
Nouveau WRInaute
Oui je les utilise en parallèle de GWT et j'ai des resultats différents sur les outils Yahoo et sur les outils Bing. En gros ce n'est guère mieux chez eux.
Chez Yahoo, il m'indique 45 pages indexées, mais seulement 4 d'entre lles ont l'information 'Last crawled : datetime' de renseignée.
Pour Bing je n'ai pas l'info sous les yeux pour vous la communiquer, mais la commande "site:" me retourne environ 56 pages indexées.

Pour en revenir a Google : à ce jour je n'ai que 28 pages présentes dans son Index (d'après les Webmaster tools) sur 74 fournies par le sitemap (dont 3 qui ne servent à rien).
Tous les liens sont accessibles depuis chaque page.
Il n'y a aucune erreur de crawl dans le Webmaster tools.

Je viens d'imprimer mon sitemap et j'ai surligné toutes les URLS présentes dans l'index Google.
De là j'essaie de trouver ce qui pourrait y avoir de bloquant entre les pages indexées et celles qui ne le sont pas.

Je ne comprends pas que certaines pages soient dans l'index alors qu'aucun lien (mis à part le menu de navigation) ne pointe vers elles.
Alors que certaines de mes pages principales qui reçoivent entre 5 et 10 liens internes de différentes pages ne sont pas dans l'index.

Ça fait 6 mois que le site est en ligne quand même ...

Je ne sais plus vraiment quoi faire, et je ne suis pas du tout sur qu'attendre changera quelque chose.

Donc je reviens encore vers vous ... si quelqu'un pourrait m'aider ... je suis prêt à faire n'importe quel test.

Merci à vous ...
 
Nouveau WRInaute
Personne alors ?

J'ai entendu dire qu'on pouvait peut etre 'rebooté' le statut d'un site via a vis de google en utilisant un blocage temporaire de l'indexation du site via les GWT .... Est ce que vous pensez que cela pourrait résoudre mon problème ?
 
WRInaute discret
Dans GWT va dans Diagnostic > Suggestions HTML et regarde si tu n'a pas de probleme ici (comme par exemple des balises meta en double etc...)
 
Nouveau WRInaute
non non j'ai déjà fais le tour de tout ça.
Aucune erreur à ce niveau, et Googlebot es encore passé le 3/11 et a tenté d'accèder à une page inexistante '/a'.

Je ne comprends pas, surtout que j'ai beaucoup travailler mon maillage interne.

(j'avoue qu'il manque toujours des liens externes pour le moment ... j'en ai quelques uns de 5 domaines différents, et une quarantaine du même domaine).
 
WRInaute discret
a mon avis GG a du trouvé des duplicate content vu qu'avec la requête https://www.google.fr/search?hl=fr&...wsgroup.fr&gs_rfai=&pbx=1&fp=8d6dd320170a0fb5 il n'affiche que les 3 premieres pages de resultats.

Je me demande si il ne repère les titres de pages Lexique comme duplicate content vu que tu changes à chaque fois un seul mot sur 6 : 'Lexique des Newsgroups : XXX| Les Newsgroups'.

Aussi j'ai regardé les sources de tes pages et tu n'a que la balise Meta description...Il te manque les balises Meta Title et Meta Keywords. Je ne sais pas si ça a un impact réel mais en tout ca ça parait bizarre quand même!

aussi sur cette page http://www.les-newsgroup.fr/serveurs-newsgroup/comparatif-serveur-newsgroup quand tu affiche la source tu constate qu'il y a des guillemets dans la Meta descritpion et donc j'ai l'impression que le premier guillemet ferme la balise meta... si tu regarde ça te parlera un peu plus
 
Nouveau WRInaute
Merci Linkcit pour ton message, tu as passé un peu de temps pour mon problème et c'est sympa. Tu es même un des seuls à avoir jamais laissé plus d'un message sur mon thread.


linkcit a dit:
a mon avis GG a du trouvé des duplicate content vu qu'avec la requête https://www.google.fr/search?hl=fr&q=site%3Awww.les-newsgroup.fr+&meta= ... 20170a0fb5 il n'affiche que les 3 premières pages de résultats.

A vrai dire j'en suis pas certain parce qu'il ne m'affiche pas le lien typique ("Google a retiré des résultats bla bla bla")
Puis aussi parce que au premier passage de Googlebot, il m'avait indexé des pages 'systèmes' de Wordpress ... j'ai modifié ensuite mon robots.txt pour lui interdire certains dossiers ou fichiers 'systèmes' (il est curieux ce googlebot c'est fou !)

linkcit a dit:
Je me demande si il ne repère les titres de pages Lexique comme duplicate content vu que tu changes à chaque fois un seul mot sur 6 : 'Lexique des Newsgroups : XXX| Les Newsgroups'.

C'est sûr que de toute manière ce n'est pas top niveau SEO. Je tacherai de changer ça ... mais en même temps c'est le principe d'un lexique .. les pages se répètent et on y peu rien.

linkcit a dit:
Aussi j'ai regardé les sources de tes pages et tu n'a que la balise Meta description...Il te manque les balises Meta Title et Meta Keywords. Je ne sais pas si ça a un impact réel mais en tout ca ça parait bizarre quand même!

Je crois bien que la Keywords ne me serivra à rien ici (en seo comme en indexation) et la balise meta title je ne l'ai jamais utilisé en fait. J'ai juste la balise <title></title>.

linkcit a dit:
aussi sur cette page http://www.les-newsgroup.fr/serveurs-newsgroup/comparatif-serveur-newsgroup quand tu affiche la source tu constate qu'il y a des guillemets dans la Meta descritpion et donc j'ai l'impression que le premier guillemet ferme la balise meta... si tu regarde ça te parlera un peu plus

Oui merci pour ce point, j'en ai d'ailleurs profité pour améliorr un peu la page.

Mais encore ici je pense pas que ça pourrait expliquer pourquoi je n'ai que 25 pages indexées sur 74 (depuis la fin du mois de mai).
 
WRInaute discret
essaye de déjà d'améliorer tout ces points.
je pense que google bloque l'indexation tant qu'il rencontre des problemes de ce type.
j'ai eu le meme souci sur un site.

pour les keywords je suis d'accord sur le fait qu'il soit peut etre pas super important aujourd'hui (et encore on n'en sait rien) par contre pour le meta title je pense qu'il est tout aussi important que la description et en complement de <title>
 
Nouveau WRInaute
Désolé de te contredire mais je n'y crois pas du tout.
D'ailleurs la plupart de mes pages de lexiques sont indexées... ce qui m'ennuie bien d'ailleurs.

Il doit y avoir autre chose.

Je me demandais plutôt si cela ne pouvais pas venir du maillage interne trop lourd.
Par exemple à la mise en ligne, le menu horizontal supérieur comprenait presque 50 liens.
Et j'en rajouter entre 3 et 10 par page dans le contenu.

Et une autre chose, mon site comporte des liens d'affiliation. Je me suis déjà demandé si cela ne pouvait pas gêné google (je les ai mis en nofollow de toute manière).

Vous avez déjà eu Une expérience sur ces problèmes là ?
 
Nouveau WRInaute
Oui j'ai aussi cette impression ... que faire pour attirer leur attention ?

10 liens PR 9 a celui qui résoudra mon probleme !!!!!!


[Joke]
 
Nouveau WRInaute
Bon personne n'a voulu de mes backlinks PR9 en cadeau ... je vois ...

Sinon j'ai réussi à résoudre mon problème.

J'ai trouvé une astuce que certains d'entres vous on peut être vu par ci par là sur des blogs récement :

Rebooter Google !

Ca consiste à faire sortir toutes mes urls de l'index et du cache google et de les réintégrer.

Depuis cette opération, et après quelques jours, j'ai 40 pages supplémentaires indexées (63 sur 74).

Il semble que Google soit resté bloqué dans sa phase d'indexation car j'avais beaucoup d'URLs non indexées qui n'avaient aucune raison d'y être.

Voilà ... si ça peut aider.
 
Discussions similaires
Haut