Un truc curieux : comme si deux algos en parralèle ...

  • Auteur de la discussion Auteur de la discussion Zecat
  • Date de début Date de début
WRInaute accro
Je constate un truc assez curieux (que je n'avais jamais vu sous cette forme à ce jour). je vous e soumets pour savoir si certains on une explication ou ont constaté la même chose.

J'explique
=======

temps 1 : Je mets en ligne trois sites, leur colle les Bl qu'il faut pour inviter les bots. Dans les quinze jours qui suivent, leur indexation se concrétise de façon tout a fait prévisible compte tenu de la nature des BL avec une courbe de type 1 puis 15 puis 1500 puis 9000 puis 32000 puis 50000 pages indexés sur deux semaines. jusque la tout va bien.

temps 2 : Puis un jour en faisant nochalamment un "site:", je revoie tous ces sites passer a 0 ou 1 pages indexée. Toujours pas d'émoi superflu. Des datacenter pas a jour, on vit ca en permanence.

temps 3 : Je vois les trois site en qustion recommencer une indexation 1 puis 5 puis 100 puis 250 pages (vous noterez le rythme bien plus calme). je me dis alors : "bon tant pis, la premiere indeaxtion est perdu, il repart de zero mais il repart".

temps 4 : Et pas une commande site: et revoila ma premiere indexation qui ressort et ui a meme continué a progresser en passantd e 50000 à 65000 pages ! sauf que une heur eplus tard je reviens a la seconde indexation qui elle aussi a continué a vivre en passant de 250 a 400 :roll: :?: :?: :?:

C'ets un peu comme si il y avait actuellement deux processus d'indexation en parralèle, qui ne partagent pas leur données (comme le ferait une synchronisation de datcenter) et qui vivent leur vie de façon autonome, à des rythme totalement différents. Et selon le moment de la journée, ca varie d'heure en heure, google search utilise l'une ou l'autre.

résultat : quand c'est la "bonn" qui est utilisée, j'ai plein de visiteurs sur ces 3 sites et hop d'un seul coup ca passe a quasi zero visteur --> verif avec site: --> et bien sur on vien de repasser sous la "mauvaise" indexation.

j'ai meme le sentiment que chaque jour les periode "bonnes" et "mauvaises" sont régulières au niveau des plages horaires ... mais la faut que je fasse un suivi plus précis pour le faire ressortir de façon evidente (c'ets juste un ressenti). En gros du style de 10 a 11h bien de 11h a 13h mal de 13h a 17 bien etc etc etc

Aveez-vous déjà vécu cela ? ca inspire quoi aux pros ?
 
WRInaute accro
Qu'il faut absoluement de la concurrence à google pour qu'il règle ses problèmes de synchronisation assez déroutants.
Mais bon chez yahoo ça a l'air de faire pareil, car ur un nouveau site (3-4 semaines) yahoo m'a parcouru de très nombreuses pages et très très rapidement, car quand je mets un nouveau lien sur la page d'accueil, dans les heures qui suivent (12 à 24h) il vient voir la page, mais rien n'apparait avec la commande site
 
WRInaute impliqué
je vois cela depuis un certain temps déja également, ce qui serait bien c'est de donner le temps entre tes phases ? 1 mois, 6 mois, 1 an ?
 
WRInaute accro
mx a dit:
je vois cela depuis un certain temps déja également, ce qui serait bien c'est de donner le temps entre tes phases ? 1 mois, 6 mois, 1 an ?
non non c'est bien plus rapide. c'est du bon Bl et donc entre mise en ligne du site et indexation complète c'est en general l'affaire de 15 jours / 3 semaines. Et donc les etapes 1 a 4 dont je parle se déroulent sur une periode de 2 a 3 semaines.

Un des sites concernés par ce phénomène est le site actuellement dans mon www. Selon le moment de la journée, la commande site va afficher 300 pages indexées ou 15.000 pages ... et puis dans deux jours il est probable que ca sera 450 et 16500 etc etc ...

actuellement c'est 300 :

https://www.google.fr/search?hl=fr&ie=IS ... e.fr&meta=

Vraiment curieux.

J'ai pas noté les DC concernés mais il me semble me souvenir que ce sont toujoursles deux même qui sont solicités.
 
WRInaute accro
Sur l'outil WRI, c'est vrai que selon les DC le nombre de pages indexées varie entre 304 (big daddy) et 27700 en passant par 14000 et 15000.
Sur mes sites ça varie aussi beaucoup mais dans une moindre mesure quand même. :roll:
 
WRInaute discret
Salut Zecat, je profite de ton post pour rebondir sur un point car c'a fait plusieurs fois que je remarque cette situation chez certains membres de wri...

Je sais que tu connais toutes les ficelles classiques du référencement,au vu des nombreux sites que tu gères (j'ai été le 1er étonné par l'appréciation très rapide de ruedemaville par les moteurs), et malgrès celà je remarque que lorsque tu présentes des sites assez récents, ces derniers ne sont pas vraiment optimisés.

Dans cet exemple, tu passes par un domaine free, tes url/dossiers ne sont pas non plus très explicites (toujours en php de surcroit), ton contenu textuellement parlant n'est pas non plus hyper développé (densité etc.) pour aider un moteur à comprendre ta thématique...

Y'a-il ici une statégie pour montrer aux moteurs que le site progresse petit à petit ?
Je pensais au contraire qu'il vallait mieux retarder au maximum la mise en ligne pour satisfaire les moteurs dès le début.

J'espère que tu nous en diras un peu plus sur ce point car je suis persuadé que cette stratégie n'est pas involontaire. 8)
 
WRInaute accro
Amibien a dit:
Salut Zecat, je profite de ton post pour rebondir sur un point car c'a fait plusieurs fois que je remarque cette situation chez certains membres de wri...

Je sais que tu connais toutes les ficelles classiques du référencement,
.
heu là je te trouve bien définitif. Non je suis un simple amateur qui ne connaissait rien au ref il y a un an et qui est un peu moins ignorant en lisant souvent wri.

Amibien a dit:
au vu des nombreux sites que tu gères (j'ai été le 1er étonné par l'appréciation très rapide de ruedemaville par les moteurs), et malgrès celà je remarque que lorsque tu présentes des sites assez récents, ces derniers ne sont pas vraiment optimisés.
.
Ben ils sont comme ils sont ...

Amibien a dit:
Dans cet exemple, tu passes par un domaine free,
.
Oui la c'est delibéré. Ce site n'a pas vocation a etre en .com.

Amibien a dit:
tes url/dossiers ne sont pas non plus très explicites (toujours en php de surcroit),
.
En quoi le php est-il un probleme en matière de ref ? Sinon pour les noms de doc, je reste persuadé que les ancres des Bl sont bien plus importants que les nom des documents.

Amibien a dit:
ton contenu textuellement parlant n'est pas non plus hyper développé (densité etc.) pour aider un moteur à comprendre ta thématique...
Y'a-il ici une statégie pour montrer aux moteurs que le site progresse petit à petit ?
.
Non aucune stratégie fumeuse telle que celle que tu decris. Simplement un site demarre avec une matiere initiale puis se développe au gré des enrichissements.

Amibien a dit:
Je pensais au contraire qu'il vallait mieux retarder au maximum la mise en ligne pour satisfaire au plus les moteurs dès le début.
J'espère que tu prendras le temps de nous en dire un peu plus car je suis persuadé que tu en sais long sur ce point.
Mauvais pioche. j'en sais pas plus que le commun des mortels. Tu m'accordes des qualités que je n'ai pas. Je ne suis pas un pro du ref pour une raison très simple : je suis un pur autodidacte en la matière et donc je connais un peu certains domaines tout en étant parfaitement igorant de pas mal d'autres domaines du ref.
 
WRInaute discret
lol t'es une vrai flèche :)

Il semble donc que j'ai fais fausse route

Non je suis un simple amateur qui ne connaissait rien au ref il y a un an et qui est un peu moins ignorant en lisant souvent wri

Ben ils sont comme ils sont ...
Ils sont ce qu'ils sont mais en tout cas tu suis de très très prêt leur développement et la comparaison de leur indexation et pour se faire manger 50 000 pages en deux semaines grâce à des bl qui vont bien tu as quand même passé le cap du simple amateurisme :)

Oui la c'est delibéré. Ce site n'a pas vocation a etre en .com.
On lit quand même de très nombreux posts dans wri kom quoi il n'y a plus aucun intérêt à se priver d'un ndd au prix ou sa coûte (ou la gestion des sous domaines) et vu les pb que c'a peut poser lorsque son site grossit et les problème inérants à free

En quoi le php est-il un probleme en matière de ref
Il est vrai que c'est plus les multiples variables qui posent problème, mais pourquoi se priver dès le début de l'html vu que tu connais le rewriting et la facilité de sa mise en oeuvre? (c'est quand même moins fastidieux que de comparer le référencement temps réel de plusieurs site)
De plus je pensais plus aux noms de tes url (/S52, /S484 etc.), même si les ancres des bl sont un point majeurs pour les moteurs, la structure des url est également à prendre en compte.

Enfin tes deux dernières réponses contredisent ce que je pensais et vont peut être me motiver pour mettre en ligne plus tôt que prévu mes autres projets.

Dans tous les cas merci pour cette réponse plus que prompte ;)[/quote]
 
WRInaute accro
Amibien a dit:
Ils sont ce qu'ils sont mais en tout cas tu suis de très très prêt leur développement et la comparaison de leur indexation et pour se faire manger 50 000 pages en deux semaines grâce à des bl qui vont bien tu as quand même passé le cap du simple amateurisme :)
J'essaie d'exploiter au mieux mes petites connaissances. Une sorte de 80/20 ... 80 % de rendement avec 20 % d'efforts.

Amibien a dit:
On lit quand même de très nombreux posts dans wri kom quoi il n'y a plus aucun intérêt à se priver d'un ndd au prix ou sa coûte (ou la gestion des sous domaines) et vu les pb que c'a peut poser lorsque son site grossit et les problème inérants à free
Tout dépend du nombre de sites que tu gères et surtout de la taille de ces sites (parce que si un NDD ne coute plus grand chose, il n'en va pas de même des octets sur disque ...). va te reserver 20 fois 300 ou 600 mo et dis moi si ca coute rien ;-)

Amibien a dit:
Il est vrai que c'est plus les multiples variables qui posent problème, mais pourquoi se priver dès le début de l'html vu que tu connais le rewriting et la facilité de sa mise en oeuvre? (c'est quand même moins fastidieux que de comparer le référencement temps réel de plusieurs site)
-pourquoi se priver dès le début de l'html : because gros consommateurs de include (entre autres). Certes je peux utiliser htacces pour embarquer du php dans du html ... mais pas chez free ;-)
- tu connais le rewritting : le quoi ? :-) :-) tu vois encore uen idée reçue. je sais meme pas ce que c'est parce que comme je fais que des sites statiques, ben le rewritting est un concept qui m'est étranger.

Amibien a dit:
De plus je pensais plus aux noms de tes url (/S52, /S484 etc.)
la c'est un decoupage purement technqiue pour pas mettre 50;000 pages dans un seul dossier (mon mac explose). Donc je les ai saucinno par paquets de quelque smilliers.

Amibien a dit:
Enfin tes deux dernières réponses contredisent ce que je pensais et vont peut être me motiver pour mettre en ligne plus tôt que prévu mes autres projets.
Je porte pas le chapeau moi :lol: :lol: :lol: tu assumes tes choix et les anneries que je peux écrire :lol: :lol: :lol:
 
WRInaute discret
Tout dépend du nombre de sites que tu gères et surtout de la taille de ces sites (parce que si un NDD ne coute plus grand chose, il n'en va pas de même des octets sur disque ...). va te reserver 20 fois 300 ou 600 mo et dis moi si ca coute rien Wink

lol oui vu comme ca c'est vrai que c'a grossit vite :)

Je porte pas le chapeau moi Laughing Laughing Laughing tu assumes tes choix et les anneries que je peux écrire Laughing Laughing Laughing

Ha ben si tu m'a "convaincu" alors maintenant tu es entièrement responsable de mes échecs futurs pour mes prochains sites :lol: lol
 
WRInaute discret
bon j'observe le meme phenomene....une indexation lente et une indexation super rapide et ceci depuis quelques temps deja....l'indexation rapide m'a fait monter jusqu'a 22 000 pages indexees (pas coherente du tout car , elle a indexe les pages d'un script php en 20 langues, en fait il n'y avait que 1000 pages reelles)maintenant tous les jours des pages sont eliminees et on en est a 9000

l'autre indexation beaucoup plus lente a indexe 1000 pages...
 
Discussions similaires
Haut