La "fameuse commande" /**** - logiciel pour tests

  • Auteur de la discussion Auteur de la discussion fredax
  • Date de début Date de début
WRInaute discret
Bonjour,

J'ai lu la longue discussion sur cette pseudo-commande et je me demande toujours à quoi elle sert exactement. Dans cette discution j'ai cru comprendre que certains demandaient des outils de test.

J'ai donc fait un petit programme qui permet de relever automatiquement les positions des X premiers sites pour une recherche donnée, avec à la fin un nombre d'étoiles allant de 0 à N. Le programme dessine un graphique.

Je mets donc ce programme à votre disposition pour que vous puissiez faire vos tests et éventuellement en tirer des conclusions. ( Attention tout de fois à l'utilisation, le programme n'est pas super "propre", puisque pour chaque test il charge la page depuis google - mais pour quelques dizaines de pages ça ira ! ).

Voilà, le programme est à l'adresse http://mapage.noos.fr/fredsgames/GG_Star_Tester.exe
Si vous souhaitez que j'y apporte des améliorations, pas de problème, demandez moi. Je suis vraiment intrigué par cette "commande".

Comme premier résultat, je peux dire qu'il y a deux grandes "époques" de boulversement ( de 0 à 1 étoile ) et vers la quarantaine.

Merci d'avance,

Frédéric ;)


[edit Cendrillon -- dans la mesure où c'est un outil que tu mets gratuitement à disposition de tous, je crois que l'on peut rendre ton lien cliquable, non ? :wink: ]
 
WRInaute occasionnel
j'ai fait un test et quasiment plus de changements après 15 étoiles.

Quelles conclusions tirer sur les significations ????
 
WRInaute discret
Oui, effectivement ça dépend des requêtes ... je suppose, mais c'est une supposition, que sur une requête comme "mp3", rien ne bouge après 10 étoiles car cette recherche doit être assez stable car pas ou peu de sites nouveaux. ( sandbox ? )
 
WRInaute discret
Sauf que, à mon avis, ça n'a rien à voir avec les accents, puisque, par exemple, sur une recherche comme mp3 ( qui n'a aucune raison d'occasionner des problèmes d'accents ), et bien les résultats diffèrent suivant le nombre d'étoiles ( faire un essai avec mon programme pour voir )...

Le mystère reste donc entier ( selon moi )
 
WRInaute passionné
fredax a dit:
Sauf que, à mon avis, ça n'a rien à voir avec les accents, puisque, par exemple, sur une recherche comme mp3 ( qui n'a aucune raison d'occasionner des problèmes d'accents ), et bien les résultats diffèrent suivant le nombre d'étoiles ( faire un essai avec mon programme pour voir )...

Le mystère reste donc entier ( selon moi )

Oui et non ;-)

EN fait je conclu de mon post avec les accents c'est qu'avec ou sans accents google reconnait les occurences des mots dans le texte, le titre et l'url etc... mais il a des requetes ou mots cles (souvent assez concurrentiels et qui applique un filtre (-> qui se visualise par un declassement) sur certains sites sortants dans les résultats sur ces mots.
J'irai même plus loin que le /********** qui ne permet pas de distinguer un groupe de mots clés. Je m'explique, si l'on prend par exemple recette gateau et bien on peut aussi avoir la requete recette gâteau et même rajouter un accent là ou il n'y en a normalement pas (mais ca google ne le sait pas) ce qui donne recètte gâteau. On s'apercoit que les résultats different suivant les trois requetes. un de mes sites sandboxé resort 1er sur recètte gâteau, un peu plus loin sur recette gâteau et encore plus loin sur recette gateau.

Effectivement ca ne marche que dans le cas ou l'on peut ecrire le mot mais on mettant un accent et google n'applique pas le filtre sur le mot avec accent. Donc pour mp3 le seul moyen de tester c'est avec le /************************
 
WRInaute discret
Donc, d'après toi, le fait de rechercher un mot avec les mauvais accents ( absence ou en trop ) donne le même effet que les étoiles ....

Et alors que signifierait le nombre d'étoiles ?
 
WRInaute passionné
fredax a dit:
Donc, d'après toi, le fait de rechercher un mot avec les mauvais accents ( absence ou en trop ) donne le même effet que les étoiles ....

Et alors que signifierait le nombre d'étoiles ?

"Mauvais accent" est mal utilisé, je dirai plutot que google filtre les résultats sur les mots sans accents et le fait de mettre les accents dans les mots ou bien d'en rajouter dans des mots qui n'en on pas, donne le même résultat qu'avec les /*****************

Maintenant comme tu le dis y'a suivant le nombre d'étoiles un classement différent que le ne peut obtenir avec le systeme des accents.
 
WRInaute occasionnel
J'arrive à une seule et unique conclusion :

- entre 1 et 17 étoiles => petites variations
- cap des 40 étoiles

il y a donc deux gros filtres à travers cette commande.
 
WRInaute impliqué
Excellent ton soft bien qu'il soit difficile de tirer des conclusions cela permet au moins d'étudier le phénomène avec un outil qui rend l'analyse beaucoup plus facile.
Serait-il compliqué de pouvoir modifier quelques paramètres de l'interrogation, genre la langue car aujourdh'ui c'est Google France que tu interroges (hl=fr), ça serait bien de pourvoir choisir (hl=fr ou hl=en ou hl=es) ?
C'est un peu ce qu'a fait Zarlboro avec Yagoort.org, il permet de modifier le paramètre de la langue HL ou le datacenter.
Qu'en penses-tu ?
EDIT: Par ailleurs je n'arrive pas à dépasser les 30 résultats avec ton soft, j'aurais voulu pouvoir analyser jusqu'à 100 résultats.
 
WRInaute impliqué
J'obtiens de très jolies courbes avec 'hotel', 'web', et des coupures nettes avec 'sonneries' (10-12 et 39-40)
 
WRInaute impliqué
Cet outil est une bénédiction, et je pèse mes mots.
Je n'ai jamais été très emballé par la théorie du "+ ton site ressort sur une requête avec un nombre d'étoiles élevés, plus ton site est sandboxé" et tout le reste, et je ne reviens pas la dessus, mais cela fait1 heure que j'étudie les courbes sur différentes requêtes et cela m'amène à me poser de nombreuses questions.
On voit l'instabilité de certains sites sur certaines requêtes et au contraire la stabilité sans failles d'autres: on voit des sites qui passe dela 2ème position avec 3 étoiles, à "pas présent dans les 50 premiers résultats" (ils disparaissent du graphe) avec 4 étoiles et qui réapparaissent avec une étoile de plus.
Mais le plus interessant est de comparer le comportement de groupes de pages (les sandboxés appartenant à de nouveaux sites, les vieilles appartenant à de veiux sites, les nouvelles appartenant à de vieux sites, avec des nouveaux sous-domaines apparenant à de vieux gros domaines, etc...) et on commence à voir apparaître des schémas récurrents.
C'est impressionant comme un petit outil de rien du tout qui ne paie pas de mine et qui à priori semble tellement inutile qu'on se demande pourquoi son créateur s'est pris la tête de le développer, peut s'avérer être une source d'informations et de surprises...j'en suis tout ému.
L'idéal serait de permettre l'étude des 100 premiers résultats (au moins), car 30 c'est trop peu, les sites sandboxés sont souvent au dela de la 100ème position et même bien au dela.
Il faudrait aussi rajouter, comme je l'ai déja suggéré dans mon précédent post, la possibilité de modifier le paramètre HL et idéallement le DC (tu devrais peut être en parler avec Zarlboro à moins que celui-ci n'intègre ton idée à Yagoort) et surtout il faudrait pouvoir suivre les résultats sur une requête dans le temps en enregistrant plusieurs rapports et en les comparant par la suite.

EDIT: On note d'énormes fluctuations d'un DataCenter à l'autre, du moins c'est comme cela que je l'interprète car les différences sont énormes lorsqu'on interroge Google sur la même requête avec ton outil à quelques minutes d'intervalles, d'où l'intérêt de pouvoir interroger un DC en particulier (quoiqu'on a bien vu ces derniers temps que derrière 1 DC on avait bien souvent plusieurs bases de données et qu'il était impossible d'interroger la même BDD à quelques minutes d'intervalles en passant par le même DC).
Sinon j'ai essayé de passer le paramètre et la valeur "&hl=es" en les collant derrière la requête mais cela a eu pour effet de polluer les résultats, donc ça n'a pas marché, et idem pour le nombre de résultats, le fait de passer le paramètre et la valeur "&num=100" derrière la requête a aussi bousillé les résultats.
J'ai donc hâte que quelqu'un nous developpe un outil sur cette base afin de réaliser des tests plus poussés.
Comme d'habitude avec ce genre d'outil, et je tiens à prévenir les enthousiastes, nous allons passer beaucoup de temps à analyser tous ces résultats pour ne pas en retirer grand chose au final, ni certitudes, ni enseignements, juste, peut être et avec de la chance, va-t-on lever un tout petit bout du voile de mystère qui recouvre l'algo de Google depuis Florida...et encore, en disant cela, je sens que mon enthousiasme m'emporte.
 
WRInaute discret
Bonjour à tous,

J'ai apporté les quelques modifications demandées ce matin avant de partir au lycée ... Les prochaines ça sera donc cet après-midi à partir de 16h ;)

La "nouvelle" version est disponible à la même adresse http://mapage.noos.fr/fredsgames/GG_Star_Tester.exe

Les modifications
- correction du bug sur la quantité de résultats ( merci Turutillo )
- ajout du paramètre de la langue
- je n'ai pas réussi à comprendre comment interroger un datacenter précis donc j'ai mis un champ avec "www.g00gle.fr" ... à vous de mettre .com ou je ne sais quoi d'autre
- j'ai rajouter une fonction Zoom
- vous pouvez aussi aggrandir la fenêtre pour mieux voir ( parce que 100 résultats ça fait chargé )
- click droit sur une courbe pour la surligner

Bon courage à tous pour vos investigations .... ( j'ai cru remarquer une certaine périodicité sur certaines requêtes dans certaines zone du classement ).

N'hésitez pas à demander des majs, je veux à tout prix savoir à quoi ça correspond ça m'intrigue trop :)

Frédéric
 
WRInaute discret
Oulala ... ba fallait le dire plus tôt oscima ... ça fait 2 heures que je suis là !

Le bug est corrigé, j'en suis désolé... ( nouvelle version toujours à la même adresse ).
 
WRInaute impliqué
Merci beaucoup Fredax, je regarde tout ça de plus près et on en reparle dans quelques jours, le temps de tirer des conclusions.
EDIT: il n'y a pas moyen d'aller au delà des 100 résultats, en fait 300 serait l'idéal car on a pas mal de sites qui apparaissent de nulle part dans les 20 premiers résultats après la 2nde vague à 39 étoiles ?
En fait leur ligne débute à 39 étoiles et ils débarquent directement en 20ème position mais en fait ils viennent surement de résultats encore plus reculés, ce qui confirmerait peut être un effet sandbox.
 
WRInaute discret
Voilà c'est fait, le nombre de résultats est toujours bloqué à 100 mais on peut analyser les 5 premières pages de résultats ( -> 500 premiers sites de l'index GG ).

Le programme ( toujours la même adresse ) http://mapage.noos.fr/fredsgames/GG_Star_Tester.exe

Un fichier d'exemple ( recherche "web site" - 500 premiers sites - 40 étoiles )
http://mapage.noos.fr/fredsgames/website.ggstartester

La barre de progression marche pas super bien ( c'est entre une et deux minutes l'analyse suivant la quantité demandée ). Ne fermez pas le programme si il a l'air planté c'est qu'il analyse :)

Frédéric ;)
 
WRInaute occasionnel
Tiens, une requête qui donne un résultat assez original :
sur "chev@ux à vendre" avec ou sans accent sur le à on a des résultats similaires : les 2 premiers ne bronchent pas, on a pas mal de cohue classique jusqu'à 35 étoiles et là... le big clash : beaucoup de sites disparaissent et forcément de nouveaux apparaissent.

Ce qui est étrange, c'est que dans ceux qui apparaissent soudainement, on trouve mon site digist@l ainsi que plusieurs sites de mes clients sur ce produit...
 
WRInaute passionné
dreamclic a dit:
Ce qui est étrange, c'est que dans ceux qui apparaissent soudainement, on trouve mon site digist@l ainsi que plusieurs sites de mes clients sur ce produit...
Des nouveaux sites ? (<6mois)
 
Olivier Duffez (admin)
Membre du personnel
fredax a dit:
Voilà c'est fait, le nombre de résultats est toujours bloqué à 100 mais on peut analyser les 5 premières pages de résultats ( -> 500 premiers sites de l'index GG ).

Frédéric ;)
cela signifie que tu analyses des pages de 100 résultats ? Tu sais peut-être que cela ne donne pas exactement les mêmes résultats qu'avec l'option par défaut d'affichage par 10 ? (j'ai pas tout suivi, tu le fais peut-être exprès)

cf. Le secret des doubles résultats

Olivier
 
WRInaute occasionnel
netsys a dit:
dreamclic a dit:
Ce qui est étrange, c'est que dans ceux qui apparaissent soudainement, on trouve mon site digist@l ainsi que plusieurs sites de mes clients sur ce produit...
Des nouveaux sites ? (<6mois)

non, ceux qui apparaissent ont tous plus de 6 mois. surtout digist@l qui se voit posé en 3° place et qui a 3 ans
 
WRInaute passionné
dreamclic a dit:
non, ceux qui apparaissent ont tous plus de 6 mois. surtout digist@l qui se voit posé en 3° place et qui a 3 ans

Les efforts de référencement sur ces sites sont-ils recents ? nbre de BL, densité des mots cles dans le contenu... ?
 
WRInaute occasionnel
ça oui par contre.
digist@l est dans dmoz depuis de 6 mois environ je crois mais les autres ont été ajoutés il y a 2 ou 3 mois.
optimisation aussi du côté des url et des titres.
 
WRInaute passionné
dreamclic a dit:
ça oui par contre.
digist@l est dans dmoz depuis de 6 mois environ je crois mais les autres ont été ajoutés il y a 2 ou 3 mois.
optimisation aussi du côté des url et des titres.

Ah ! je me disais bien qu'il y avait quelque chose ;-)
Et quel a été ton meilleur classement pour digist@l ?
 
WRInaute discret
@Olivier : Oui, j'avais lu l'article en question dans WRI. Mon programme ouvre des pages de 100 résultats par soucis de rapidité ( en effet c'est déjà assez long, alors ouvrir 100 pages au lieu de 1 ... :P ). C'est vrai que les résultats sont, du coup, un peu trafiqués, mais cela est peu important dans l'étude qu'on essaye de faire

Alors, on en est où ? Vous pensez que cette requête enlève un filtre anti-optimisation-récente ? Que représenteraient les étoiles ?

Je pense qu'on est d'accord pour dire 2 choses sur le nombre d'étoiles :
1- ne correspond pas à une donnée temporelle ( sinon les fameuses "39" étoiles seraient maintenant plutôt à 35-36 ) Or on ne constate pas de décalage du grand nettoyage des 39.
2- ne correspond pas non plus à des mots vides. Car dans ce cas, comment expliquer que tous les changements importants sur toutes les requêtes sur les 500 premiers résultats se fassent globalement dans la même zone de 39*

Voilà des mini-conclusions ... je vous laisse investiguer ... N'hésitez pas à me demander des modifications, je suis là pour ça ;)
 
WRInaute occasionnel
J'ai commencé à suivre tout ça que depuis l'automne dernier.

le meilleur classement sur GG semble être l'actuel : 23 sur chev@ux et 48 pour vente chev@ux.

Globalement, GG semble reprendre tous les sites du système en de meilleures graces depuis 2 ou 3 semaines... petit à petit.

Plusieurs sites du système obtiennent de très bons classements sur MSN et Yahoo.

Si des conclusions peuvent être tirées de tout ça, je suis preneur.
 
WRInaute impliqué
je viens de telecharger ton logiciel, il ne fonctionne pas avec des requetes à deux mots clés, il génère une erreur et meme parfois avec un seul mot clé, le logiciel fonctionnait sur un autre poste et il ne fonctionne plus maintenant, l'as-tu modifié ?

Merci à toi.
 
WRInaute discret
Effectivement, en fait, le bug devait déjà exister, mais n'a jamais été vu. En fait, cela a l'air de dépendre du Data Center qui renvoit les résultats ... or, comme par défaut on laisse le choix à GG du data center, et bien parfois ça marche et parfois pas ....

J'explique le bug pour ceux que ça intéresse. Parfois GG renvoie les résultats sous la forme <p class=g><a href="URL"> et parfois <p class=g><!-- n --><a href="URL"> .....

Voilà voilà .... j'ai corrigé le bug ( le programme est toujours à la même adresse ). Je prépare une version plus efficace dans l'affichage graphique pour pouvoir mieux analyser parce que là le programme mouline un peu :) ...

Merci à nitou de m'avoir signalé le bug ;)
 
WRInaute impliqué
Je pense que tu as regardé la discussion Résultats avec ou sans accents et sandbox.
Par exemple je suis 1er avec 'knowlèdege management', cela m'étonnerait que le fait d'ajouter un accent ici ajoute une variable (contrairement à ce que j'ai dit dans la discussion) : personne n'a mis un accent ici : avec '+knowlèdge management' : aucun résultat (mais il y en a avec '+knowlédge management') ! Le chemin entre la requête et les résultats ne doit pas être le même.
Tu ne détectes rien ? ni au niveau de la 40ème requête, ex. sonneries sur ton outil il y a une coupure : les sites dont la courbe est coupée n'apparaissent plus dans les 30 premiers résultats ? Quand il y a une coupure, tu pourrais voir où le site part ?
C'est quoi le <!-- n --> ?
Tu pourrais déceler des changements de DC ? les indiquer ?
Beaucoup de questions, il y a encore du boulot !
 
WRInaute discret
J'ai effectivement regardé cette discution, et c'est en partie à cause d'elle que j'ai fait ce programme. En effet, il me semble que la théorie " une étoile = un mot non défini " n'est pas valable, car, dans ce cas, on ne peut expliquer que, quelque soit la requête, la "crise des 39" est intacte.

1°/
Le chemin entre la requête et les résultats ne doit pas être le même.Tu ne détectes rien ?
Je n'ai pas compris ce que tu voulais dire par là ? Veux tu dire que avec des accents, mon programme bug ?

2°/
ex. sonneries sur ton outil il y a une coupure
Pour "sonneries", j'obtient ça moi comme courbes.
sonneries.gif


3°/
Les sites dont la courbe est coupée n'apparaissent plus dans les 30 premiers résultats ?
Oui, exactement.

4°/
Quand il y a une coupure, tu pourrais voir où le site part ?
Oui, on pourrait mais ce n'est pas encore fait, je vais le rajouter. Cependant, tu peux faire tes analyses sur les 500 premiers résultats comme ça tu auras déjà moins ce problème. Cependant, les sites qui "apparaissent" avec les étoiles sont souvent plus loin que la 1000ème place -> invisibles.

5°/
C'est quoi le <!-- n --> ?
C'est Google qui n'a pas la même façon de présenter sa page HTML en fonction des Data Center, donc mon programme s'embrouille ... mais ça ne devrait pas influer, si un site l'a tous doivent l'avoir .... Je vais essayer d'y remédier

6°/
Tu pourrais déceler des changements de DC ? les indiquer ?
Ca par contre je ne vois pas trop comment faire ... Si quelqu'un sait comment faire je suis prenneur ... A ton avis, GG indique-t-il le Data Center quelque part sur la page ? Je vais chercher ....

7°/ Merci à tous ceux qui veulent participer d'essayer d'adopter une démarche plus ou moins "scientifique", en avancant des hypothèses, des conséquences vérifiables/vérifiées, et des conclusions, même partielles, sur certains points ... Merci aussi d'essayer de tout numéroter pour qu'on s'y retrouve

8°/ Appel à des compétences ( Merci de me contacter par MP si vous pensez pouvoir aider ) :
- Quelqu'un a-t-il utilisé l'API google en programmation logiciel ?
- Quelqu'un sait-il dire de quel Data Center vient une page de résultats GG ?
- Quelqu'un sait-il si on peut récupérer les résultats au delà de la 1000ème place ?

Beaucoup de questions, il y a encore du boulot !
Oui, mais si on le fait c'est que ça nous plait ;)

Je remets les mains dans le code ce week-end pour vous concocter une version :
- plus efficace graphiquement
- avec moins de bugs dans les requêtes GG
- permettant d'afficher plus d'informations sur chaque site
- permettant de comparer des groupes de courbes

Frédéric
 
WRInaute impliqué
fredax a dit:
Le chemin entre la requête et les résultats ne doit pas être le même.Tu ne détectes rien ?
Je n'ai pas compris ce que tu voulais dire par là ? Veux tu dire que avec des accents, mon programme bug ?
Non pas de bug décelé dans ton programme
Rappel : Quand tu mets un '+' dans la requête juste devant un mot contenant un accent, l'accent est maintenu et les résultats contiennent l'accent.
Regarde les différences avec les requêtes 'thé' et '+thé'.
Cela indique(rait, rien n'est absolument sûr avec Gg) que les mots accentués sont bien conservés comme tels dans l'index. Il semble(rait, bon c'est le dernier que je mets) que l'interface enlève les accents (sauf si tu mets un '+') avant de passer la requête à un 2nd module qui effectue la recherche dans l'index.

Cest ce qui explique(rait) que les requêtes avec des accents inventés conduisent aux mêmes améliorations de positionnement que les requêtes +ou-étoileouadsf : tout cela perturbe le chemin classique complet qui dans une de ses étapes recule (au fin fond des résultats parfois) les sites pénalisés (avec au passage une éventuelle reconnaissance d'une requête concurrentielle).
 
WRInaute discret
Une question, est ce que qqu'un qui avait remarqué une meilleure position avec /n* est déjà remonté dans les resultats ou pas?
 
WRInaute discret
Remonte petit petit topic :wink:

Parce que si personne n'est jamais remonté ... il n'y aurait vraiment aucun interêt à ce prendre la tête avec cette commande ...
 
WRInaute discret
Oui sauf que, à mon avis, les développeurs de chez GG sont assez occupés... Donc ils ne predraient pas leur temps à développer une commande étrange.... Les étoiles signifient donc quelque chose ... mais quoi, la question reste entière ... J'améliore le programme et on en reparle ;)

La supposition la plus vraisemblable est que ces étoiles enlèvent un filtre ... filtre qui dépend peut-être du nombre d'étoiles ? Dans ce cas, savoir de quel filtre il s'agit permettrait de savoir pour quelle raison GG nous "sanctionne" ou du moins, nous positionne plus bas, et donc de travailler plus le point en question ....
 
WRInaute occasionnel
Merci pour ce logiciel en tout cas.

C'est beaucoup plus clair comme cela.

Je me demandais, j'ai récemment optimisé un site pour apparaître sur la requête "achat nom de domaine", et j'ai donc fait pas mal de BL depuis d'autres sites avec ce mot clef ... (J'ai fait cela il y a un mois environ).

Grâce à ton logiciel, je peux voir clairement que, en augmentant le nombre d'étoiles, le site (h**p://www.services-webmasters.net) n'arrête pas de monter dans les résultats, et c'est d'ailleurs le seul à réellement monter par rapport à tous les autres sites sur cette requête.

Serait-ce donc une succession de filtres que Google efface au cours du temps pour éviter une montée trop rapide de pages recevant trop de BL avec un mot-clef identique ?

Ca m'étonnerait en tout cas que ce soit aussi simple vu les "cassures" que l'on peut observer sur certaines requêtes : c'est parfois vraiment byzarre ...

Exemple avec "enregistrer nom de domaine" :

graphe.gif


D'ailleurs, ça me fait penser que le premier sur la requête utilise des pages satellites, ce qui ne gêne absolument pas Google, bien au contraire ... :arrow:
 
WRInaute discret
fredax a dit:
Oui sauf que, à mon avis, les développeurs de chez GG sont assez occupés... Donc ils ne predraient pas leur temps à développer une commande étrange.... Les étoiles signifient donc quelque chose ...

Heu je dirais hors sujet ... Dans ma question il n'est pas question de "supposition" mais "d'affirmation" ... Qq'un a qq chose de concret à affirmer?
:D
 
WRInaute discret
-J- a dit:
fredax a dit:
Oui sauf que, à mon avis, les développeurs de chez GG sont assez occupés... Donc ils ne predraient pas leur temps à développer une commande étrange.... Les étoiles signifient donc quelque chose ...
Heu je dirais hors sujet ... Dans ma question il n'est pas question de "supposition" mais "d'affirmation" ... Qq'un a qq chose de concret à affirmer?
:D

On s'est mal compris .... Ce que je voulais dire, c'est que, peut-être cette commande ne représente pas un filtre anti-sandbox avec le nombre d'étoiles = le temps à attendre. D'ailleurs cela est même sûr puisque le chamboulement des 39 n'avance pas ... et que personne n'a vraiment vu son site remonter. Mon espoir c'est que ces étoiles représentent certains filtres, et qu'en arrivant à en déduire quel filtre, on puisse travailler ce qui ne va pas dans nos sites pour remonter réellement et non virtuellement dans le classement ... J'espère avoir été clair :)
 
WRInaute occasionnel
Salut,
Je testé cet outil qui m'a donné vraiment ce que j'attendais :

pour les mots clés :
Commerces bordeaux
mon site reste relativement entre 1 position et 2eme position,
Mais je regarde le graphique et je vois que c'est moi qui est le plus present dans toutes les etoiles.
Pour un autre sujet qu franchement j'ai abordé une seule fois sur mon site :
windows libre
Position 1 sur toutes les etoiles,
Donc ce que j'ai pu remarquer c'est que :
les etoiles doivent etre en fait un test algoriythmique de pertinence, et donc, moins tu as de coupures dans le resultat plus tu risque d'etre en premier.

Ce que je me dis aussi ce que la comunnautée de windows libre parle plus souvent de ce sujet que moi, donc comment ça se fait que moi je sois premier dans le monde?
Le pas logique : Mon url ne porte pas les mots cles.
Mon PR est inferieur à celui que eux ils ont.
Dans la description que Google fournit il ne resort même pas les mots clés.
Je ne suis pas //W3C//DTD XHTML 1.0 Strict vraiment pas du tout.
L'addresse qui reste tout le temps en premier c'est "article.php?sid=59& mode=thread&order=0&thold=0" 3 &&& operateurs(dingue ça)
Je passe devant clubic, pcinpact, framasoft,winlibre (eux memes).
plus de 1 770 000 resultats.
Mon site n'est pas du tout optimisé pour "Windows Libre" seulement dans cet article il y à optimisation pour ce mot clé, balise entete et tout le bazard, mais pas fait expres, j'ai fait des entetes naturelles.
Je suis le seul à metre mes mots clés sans espaces. (commerces,bordeaux,logiciels,meteo,météo,Meteo,Météo,etc...)
Je suis le seul à avoir archivé ce sujet dans articles anciens.
Je suis le seul à utiliser tous les METAS : copyright email createur, tous.
C'est peut-etre la page la plus lourde de toutes.
Je suis le seul à faire je sais pas combien de fautes c'est enorme. (J'en suis desolé pour mes lecteurs)

Le logique : Je suis le Seul à mettre en tittre "Windows Libre" (WinLibre)
Je Travaille sur mon site toutes les 4 heures si ce n'est pas moins.
Je regarde pas especialment ces mot clés.
Je ne casse pas mon email pour l'anti-spam, tant pis si j'en reçois.

Ma conclusion peut etre attive, mais,
Je crois que c'est une requette que le moteur lui même fait dejà internement peut etre pour tester precisement des algorythmes de presence... et celui qui est le plus present et bin gagne la premier place.
à chaque asterisque il doit faire ça :
* windosw libre
** windsow libre
*** winsdow libre etc...
Il doit par ce fait faire une faute et chercher internement les propositions à la "Google" à chaque * et selon la proposition qu'il fait il refait une nouvelle recherche et ce sera celle-là qui serà la plus pertinente puisque ce serà lui même qui aura fait la proposition.
Plus de propositions il fera, et plus ton site sortira dans cette proposition en premier ou en deuxieme ou pas du tout, ceci donnera cette ligne casse ou pas casse et lui dira au moteur de recherche celui qui à repondu à chaque fois le plus souvent dans une fourchette limitée par l'utilisateur lui même (Français, le web entier etc..)

Donc, plus ton site reponds internement aux propositions de google ettant ton site en premiere position le plus souvent possible, plus dans la vrai proposition tu serà en premier.

Le fait que de grandes entreprises Françaises soient derriere un petit site comme le mien, espagnol et pas Français, donc ecrivant mal le français (désolé) me fait penser à ça.
Peut-etre tiré par les cheveaux mon histoire mais bon, regardez dans les resultats :
"allez sur Google"
prennez ces mots clés : windows libre sans guillaumets telquel
Faites une erreur à chaque fois, juste changez une letre de place
à chaque fois vous verrez Google vous proposer la bonne combinaison.
Et la bonne combinnaison à chaque fois c'est moi en premier.
Vous pouvez combiner comme ceci aussi windwso lirbe Il sait toujours que c'est "windows libre" il vous le propose et c'est toujours sur moi que ça tombe. (Combien de combinaisons comme ça?)
Pour "commerces bordeaux" je sais pourquoi je suis pas toujours en premier.
Pour la requete "commercse bordeaux"
il me propose "commerce bordeaux" et sur commerce sans le "s" j'ai pas fais le necessaire.
Pour confirmer cette theorie, j'avais mis en premiere page il y à 5 jours un article qui parlé d'un "commerce bordeaux" ensemble. J'ai peu affirmer que pendant un laps de 2 jours j'etais tout le temps 1er.
De que j'ai rajouté un autre article en corrigeant cette erreur en mettant à la place "commerce de bordeaux" ça y'est oscillations dans les resultats.
J'ai pour le moment un PR3 et Google mets seulement à jour tout les 2 jours l'entete du site "et le cache si chagement il y à eu avec un crawl de tout mon site si je fais un changement sur ma page d'accueil".
Qu'on m'arrete si je dis de betises !!!

Les chemins de Google sont impenetrables..... ou presque
 
WRInaute discret
fredax a dit:
On s'est mal compris .... Ce que je voulais dire, c'est que, peut-être cette commande ne représente pas un filtre anti-sandbox avec le nombre d'étoiles = le temps à attendre. D'ailleurs cela est même sûr puisque le chamboulement des 39 n'avance pas ... et que personne n'a vraiment vu son site remonter. Mon espoir c'est que ces étoiles représentent certains filtres, et qu'en arrivant à en déduire quel filtre, on puisse travailler ce qui ne va pas dans nos sites pour remonter réellement et non virtuellement dans le classement ... J'espère avoir été clair :)

Je vois ce que tu veux dire ... mais c'est pas gagné !
 
WRInaute occasionnel
pouet50 a dit:
Grâce à ton logiciel, je peux voir clairement que, en augmentant le nombre d'étoiles, le site (h**p://www.services-webmasters.net) n'arrête pas de monter dans les résultats, et c'est d'ailleurs le seul à réellement monter par rapport à tous les autres sites sur cette requête.

Je viens de prendre ton exemple :
enregistrer nom de domaine
Bizarrement dejà 23 etoiles = 23 caracteres.
Mais bon vas sur Google et fais cette recherche :
enregistrer nom de domine
Google te presentera comme d'hab la bonne orthographe mais...
Aussi 28 200 resultats pour "enregistrer nom de domine"
allez je suis Google et dejà j'ecarte 28 200 resultats sur cette requete si l'internaute decide de cliquer sur sa proposition. (Google aprend tout seul les sites qui ecrivent mal?).
On continu :
enregistrer nom de dommaine avec 2 mm
1 040 sites qui ont mal ecrit.

allez Hop, je suis GoogleBot et j'apprends à chaque requete de l'internaute avec faute d'ortographe tous les sites qui ecrivent mal ce mot, si l'internaute clique sur la proposition.

Resultat, les ****** serait peut etre aussi un preenregistrement pour lui, de toute possibilité d'erreur, c'est peut etre aussi que c'est pour ça que plus vous en mettez, plus Google ferait le filtre tout seul, mais il les bannirait pas tout de suite de cette requette, il attendrai patiement un internaute pour confirmer, pour ensuite le mettre au fin fond de ses resultats.
Melangez tout ça avec les titres, les mot clés, les bon metas et les bon conseils de WRII et vous obtennez que la plupart des membres qu'ils ont suivi ces conseils se trouvent eux le plus souvent en premier. (quelq'un ayant suivi des conseils de WRI peut temoigner du contraire?)

Je recapitule :
Hypothese :
Google à d'office cette function dans sa tete chercheuse.
à chaque requete il se fait une idée du site le plus present dans sa proposition d'erreur. la proposition peut varier, donc celà expliquerai les oscillations.(lui même ferait : 23 * 23 = 529 * 23 = 12.167 erreurs possibles sur 475 000 résultats, pour 23 etoiles bien sur.)vous enlevez dejà ces resultats que lui trouvera moins pertinant, mais jusq'a preuve du contraire il continue à montrer sur les premieres pages de resultats.
De que un internaute confirme une de ces regles, il confirme les positions données avec les *******.
Donc les asterisques, seraient des futures positions par rapport à des erreurs hypothetiques en attente de confirmation. En faisant la requete
/****** ,exemple on verait que ces resultat hypothtiques? n'oublions pas que beacoup de crapules utilisent cette methode de "erreur de l'internaute" pour attirer leur attention, et qu'il font expressement des erreurs eux mêmes. (Google aime pas trop tromper l'internaute)

Google Inteligence Artificielle?
Le secret de son succées serait l'Interactivité avec l'internaute?
Vous immaginnez ce filtre melangé avec d'autres?
Qu'on m'arrete si j'ecris tout ça pour rien.

EDIT ) L'immage elle faisait decaler plus le forum
 
WRInaute discret
C'est intéressant tout ce que tu racontes ;) ... j'ai pas trop le temps de réfléchir là, mais ce soir j'y penserai....

Si tu crois à ce que tu dis, essaye de formuler très clairement une hypothèse et surtout des conséquences vérifiables, de façon à ce que tes conclusions soient prouvées... :P
 
WRInaute impliqué
fredax, t'es là ??
regarde test1 : ma page est celle qui est 1ère à la fin, position généralement remarquée dans les résultats Gg: 3ème
test2 : ma page est celle indiquée, aujourd'hui elle disparaît puis réapparaît puis repart dans les réponses sur Gg, tu vois sur la courbe avec 0 * elle n'apparaît pas

C'est quoi ces coupures ? 8O 8O
Tu peux détecter ?
la requête est : intelligence économique
 
WRInaute occasionnel
J'essai de telecharger mais il me dit page 404.
Zut alors j'allais me baser sur celui là pour attester de ma theorie.
ça fait trop scientifique ça LOL j'm'la pete.
C'est possible d'avoir une autre façon de l'avoir?
 
WRInaute discret
Je n'ai pas compris ou était le problème dans la courbe du test1 ... Le test2 est buggé mais j'ai corrigé ce bug ....
 
WRInaute impliqué
Salut, il est tôt pour un dimanche
J'ai indiqué hier deux images de résultats

test1 ma page est présente dans Gg, je n'indique pas de bug

test2 à un moment où ma page est absente de Gg, quand je tape alors son adresse -http://ocsima.neuf.fr/Intelligence-Economique.htm Gg répond : pas de résultat

Es-tu sûr que ce tu appelles bug est bien un bug ?

En ce moment elle est présente (3ème) sur https://www.google.fr/search?hl=fr&c2cof ... ique&meta= mais il y a toujours une coupure dans les résultats pour les 28-30 étoiles, essaye la requête toi même
 
WRInaute discret
Lorsque je tape "intelligence économique" tel quel dans le champ requête de mon programme, j'obtiens ( je l'ai obtenu trois fois de suite ), la courbe suivante :

intelligence-economique.jpg


Où est la coupure entre 28 et 30 étoiles ?
 
WRInaute impliqué
j'avais obtenu à 7h ce test3je viens de la refaire, et je n'ai plus que la coupure habituelle : test4
A quoi cette dernière coupure correspond-elle ?
 
WRInaute discret
Voilà qui est clair ! J'ai enfin compris de quoi tu parlais. Cette coupure ne représente absolument rien à part le fait qu'il y a encore un petit truc que je n'ai pas apprivoisé apparemment. En effet, si tu balades ton curseur sur cette coupure, tu vas te rendre compte que les URLs sont différentes ( il y a des trucs en plus au début ou à la fin ). C'est notre ami GG qui s'amuse à rajouter des genres de paramètres en début ou fin de liens ...

En bref, si vous avez quelque chose de la sorte, n'y faites pas attention !
 
WRInaute passionné
8O 8O 8O Mais comment ai-je pu passer à coté de ce post 8O 8O 8O

Je tiens à féliciter fredax pour le travail fourni sur son soft et le remercier d'en faire profiter les wrinautes.

je me mets dessus afin d'analyser quelques requêtes, et j'espère pouvoir confirmer ce que j'avançais il y a déja quelques jours sur l'utilisation d'un coeficient de concurence utilisé pour le sandbox.

Résultats dans quelques jours, le temps de faire quelques essais . :wink:
 
WRInaute impliqué
oli004 a dit:
Je tiens à féliciter fredax pour le travail fourni sur son soft et le remercier d'en faire profiter les wrinautes.
+1
Depuis deux trois jours je suis absent d'un dc pour un mot clé : http://66.102.9.104/search?hl=fr&q=know ... gement&lr=
présent (même page index) pour un autre mot clé sur ce même dc : http://66.102.9.104/search?hl=fr&q=gest ... sances&lr=
présent avec 1 étoile : http://66.102.9.104/search?hl=fr&q=know ... t+%2F*&lr=
présent sur les autres dc (outils wri) http://216.239.37.104/search?hl=fr&q=kn ... gement&lr=
(si je peux croire que je suis toujours sur le même dc)
Je ne sais pas si fredax a pu analyser ce qui crèe les coupures dans 'ses' courbes (les trucs que rajoute Gg aux url dans les résultats)
 
WRInaute impliqué
Merci fredax aussi :wink: ,
Juste pour info, j'ai entre 4 et 7 DC (selon l'heure) qui correspondent aux résultats obtenus avec 35-36 étoiles.
Tout à l'heure, le logiciel est tombé sur un DC intermédiaire, qui me faisait perdre environ 10 place pour une étoile, puis monter après les 35 *.
J'ai remarqué des reprises de courbes sur des sites qui ne sont pas présent dans les résultats avec moins d'étoiles. Et des coupures pour les sites qui disparaissent avec plus d'étoiles.

Je ne sais pas si il y a quelque chose à en déduire :? , mais voilà mes observations.
@+
 
WRInaute discret
En revanche si c'est vraiment quelque chose d'important chez Gg, je me dis que ça ne restera pas bien longtemps. Au contraire si c'est quelque chose d'insignifiant (ce que je ne pense vraiment pas) alors ils nous laisseront faire mumuse.

En tous cas un grand merci à Fredax, pour ce fabuleux travail.
 
WRInaute discret
pour info il y a quelques semaines (sand box pas dans gg directory) pour me voir en premiere page il me fallait une quarantaine d'étoile maitenant je suis en premiere page (present dans gg directoy sorti de sand box) et avec une étoile je suis premier etrange....
 
WRInaute passionné

ben non, ....logique.

As tu determiné quelle a été ta période de pénalisation? ou as tu reussit a determiner le pourquoi de cette sortie subite du sable ? (directory de GG peut etre ?)
 
WRInaute discret
je sors du sable à la mise à jour de GG directory ça c'est normal ou du moins c'est ce qui a l'air d'arriver chez pas mal de monde.
mais ce qui est bizare c'est qe si il s'agissait d'une période de pénalisation je ne serait pas passé de 35 à une étoile d'un coup. à moins que j'ai loupé des trucs ce qui est possible.
 
WRInaute discret
@fredax: peux tu ajouter assez facilement les axes avec le nombre d'étoiles et le nom des sites s'il te plaît.
 
WRInaute discret
@doeurf : Je vais essayer ;)

Je vais essayer de m'occuper de tout ça mais j'ai vraiment pas beaucoup de temps en ce moment ... Enfin si vous voyez des modifications à apporter essayez de me les donner clairement ( genre en gras que je les loupe pas )

A bientôt pour une nouvelle version,

Frédéric,
 
Discussions similaires
Haut