Test t3 : étude de l'effet sandbox

WRInaute passionné
houlala! c'est le b.... ce forum! Les consignes ne semblent pas respectées! Je me suis tapé tout le forum et je pense que le test que je propose devrait s'appeler Test t3? Bah! le modérateur rectifiera! :wink:

Comme le dit le titre, l'objet de ce test et d'essayer d'en apprendre un peut plus sur l'effet sandbox en effectuant des mesures sur plusieurs sites et plusieurs mots clés.

En fonction des connaissances ou suppositions de la "communauté" sur l'effet sandbox, j'ai scindé les parametres à mesurer en deux catégories:

  • Les parametres liés au site:
    • * Date de mise en ligne car l'age du site semble avoir de l'importance
    • * Evolution du nombre de BL car là aussi, la croissance du nombre de BL semble influer sur l'effet sandbox
    • * Nombre de pages indéxées par GG (relevé en même temps que le Nbr de BL) pour mesurer si la taille du site influe sur l'effet sandbox

  • Les parametres liés aux mots clés:
    • * date du test
    • * le (les) mots clés testés
    • * le nombre de requetes sur ce (ces) mots clés
    • * Nombre de resultat et position du site avec 50,40,30,20,10 et sans *

En suivant l'evolution des positions sur les mots clés (1 seul test par semaine) on devrait, en recoupant avec les autres informations, avoir une idée plus précise des causes de l'effet sandbox, et en continuant l'étude sur une longue periode, mesurer le durée de cet effet en fonction des autres parametres.

Je sait que nous n'obtiendrons pas de resultats probants dans un delais court, mais je crois que le jeu en vaut la chandelle.

J'ai déja préparé la BDD et les pages de saisie, mais avant de publier l'adresse j'attends vos commentaires sur:
  • * l'interêt de ce test
  • * les paramètres que j'aurais oublié
  • * savoir si l'accés à ce test doit être libre ou réservé à la communaute WRI

Vous savez tout!

:arrow: édité à cause d'un oubli de parametre

Liste des inscrits: fandecine, Oli004, Phix, achtungbaby
 
WRInaute passionné
Bonne initiative? Je voulais le faire, mais manque de temps et de maitrise informatique pour gérer a grande echelle.

Mes commentaires :

* Date de mise en ligne car l'age du site semble avoir de l'importance

Pas l'age du site, mais l'age de la page que l'on souhaite positionner. Car u site peut vouloir se positioner sur plusieurs requêtes n'ayant pas de point commun. Il a été constaté qu'un site peut être dans le sable sur une requête et pas pour une autre.

* Evolution du nombre de BL car là aussi, la croissance du nombre de BL semble influer sur l'effet sandbox

Difficilement contrôlable puisque gg n'affiche que ceux qui lui semble importants, de plus les mises a jour de BL ne sont pas très fréquentes.

* Nombre de pages indéxées par GG (relevé en même temps que le Nbr de BL) pour mesurer si la taille du site influe sur l'effet sandbox

Oui, facilement contrôlable, sauf lorsque des datacenters sont à la bourre

* Nombre de resultat et position du site avec 50,40,30,20,10 et sans *
En suivant l'evolution des positions sur les mots clés (1 seul test par semaine) on devrait, en recoupant avec les autres informations, avoir une idée plus précise des causes de l'effet sandbox, et en continuant l'étude sur une longue periode, mesurer le durée de cet effet en fonction des autres parametres.

L'outil de fredax est très pratique pour ça, toutefois, pour ma part, la sortie de sable a ete brutale (plus de 400 places d'un coup en up) donc je pense que les courbes recueillies a la longue ne donne qu'un crenau. Ceci dit, si le debut de sandbox est connu, cela peut permetre de connaitre la durée de sandbox pour une requête donnée.

...j'attends vos commentaires sur:
* l'interêt de ce test

Faire prendre concience aux nouveaux webmasters des la notion de durée associé a un référencement pour une requête donnée.

* les paramètres que j'aurais oublié

pour une requête donnée, renseigner : le nb de réponse proposées par GG, le nb d'awords, le PR moyen des 20 premières positions, l'age moyen des 20 premieres pages (pas du site, mais de la page), et d'autres peut-être...

* savoir si l'accés à ce test doit être libre ou réservé à la communaute WRI

:roll: mmmh :roll: amha, plus de monde participera, plus le résultat sera probant. Ceci dit, même si il n'y a que la communauté de WRI qui en beneficie, ça fait déja plus de 23000 requêtes potentielles.
Je ne me prononce pas sur cette question.
 
WRInaute passionné
Enfin une réponse! :D

j'allais finir par croire que ,malgré le grand nombre de post sur l'effet sandbox, personne ne souhaitait en savoir plus.

Bon, voyon voir...

oli004 a dit:
Pas l'age du site, mais l'age de la page que l'on souhaite positionner. Car u site peut vouloir se positioner sur plusieurs requêtes n'ayant pas de point commun. Il a été constaté qu'un site peut être dans le sable sur une requête et pas pour une autre.

dur à mettre en oeuvre, par exemple j'ai plus de 40000 pages! C'est pourquoi je proposais la date de mise en ligne du site pour avoir une idée de l'ancienneté. Et puis, si ce que tu dit est vrais, toutes les actualités seraient sandboxés. Ensuite il est évident que les mots clés doivent etres en rapport avec le site (pour notre test tout au moins)

En ce qui concernne les BL, l'objectif est de trouver si il y a correlation (et de la mesurer) entre la courbe de croissance des BL et l'effet sandbox.

Le fait de rajouter le nbr d'adwords ainsi que le PR et Age moyen des 20 premières page est à retenir (maintenant il faut voir comment les calculer)

Enfin, lorsque je demande si le test doit être public ou pas (accés par mot de passe obtenu si on est membre de WRI) c'est pour éviter les parasitages et controller un peu la validité des informations fournies pour ne pas fausser les resultats.

Je rajoute tes parametres à l'outil en attenadnt de nouveaux posts :D
 
WRInaute passionné
Enfin une réponse!

j'allais finir par croire que ,malgré le grand nombre de post sur l'effet sandbox, personne ne souhaitait en savoir plus.

Les comentaires se font rare, mais tu n'as qu'à mettre en ligne ton outil et donner l'url, tu veras que le compteur de visite risque de vite s'emballer :wink:

C'est pourquoi je proposais la date de mise en ligne du site pour avoir une idée de l'ancienneté.

C'est vrai qu'il est difficile de gerer plusieurs pages d'un site. Admettons donc que l'on ne se llimite qu'à l'index, ce qui est déja bien.

Et puis, si ce que tu dit est vrais, toutes les actualités seraient sandboxés.

Remarque judicieuse, mais une nouvelle répond-t-elle vraiement à une requête? Ce que je veux dire, c'est qu'il est difficile de "cibler" ou "optimiser" une nouvelle. Puisque c'est de l'information, je présume (sans conviction) que le "traitement" infligé par gg aux sites composés essentiellement de nouvelle est différent (voir même pas touché par sandbox)

Ensuite il est évident que les mots clés doivent etres en rapport avec le site (pour notre test tout au moins)

Oui tout à fait d'accord avec toi.

En ce qui concernne les BL, l'objectif est de trouver si il y a correlation (et de la mesurer) entre la courbe de croissance des BL et l'effet sandbox.

Je suis d'acord sur le principe, mais encore une fois, le nombre de BL affichés par gg n'est qu'indicatif et ne comprend pas TOUS les BL.
Exemple 10 BL de qualité affichés par gg et 500 de spam cachés. un autre site ayant aussi 10 BL affichés mais seulement 3 autres ignorés. Tu vois, les deux sites ont 10 BL affichés mais c'est ce qui ne se voit pas qui peut être pénalisant.

.... et Age moyen des 20 premières page est à retenir (maintenant il faut voir comment les calculer)

Techniquement, je ne sais pas, mais dans la pratique, c'est déja réalisé par le sandbox detection tool de SEOmoz (au passage, je constae que dorénavent il faut être enregistré pour faire le test, c'est nouveau :cry:

...c'est pour éviter les parasitages et controller un peu la validité des informations fournies pour ne pas fausser les resultats.

+1
 
WRInaute passionné
Re: Test t3: Etude de l'effet sandbox.

fandecine a dit:
  • * le nombre de requetes sur ce (ces) mots clés
  • * Nombre de resultat et position du site avec 50,40,30,20,10 et sans *

Je crois qu'il serait intéressant de mesurer le prix en enchères adword des mots-clés.

Concernant les requêtes avec les /***, elles donnent des résultats vraiment très étranges sur les requêtes que je suis. Sans pouvoir le prouver, je pense que les *** n'ont plus de rapport avec l'effet sandbox (alors que j'étais convaincu du contraire jusqu'à il y a quelques jours).

Je me demande aussi si la cause de l'effet sandbox n'a pas changé de nature depuis Bourbon. Voilivoilà 8)
 
WRInaute passionné
Re: Test t3: Etude de l'effet sandbox.

lafleur2004 a dit:
Je crois qu'il serait intéressant de mesurer le prix en enchères adword des mots-clés.

pfuiii! Tu le connais toi le prix des enchères adwords! 8O Par contre, le nombre d'adwords sur un mot clé, ça se trouve!

Pour ce qui est de /****** et de l'effet sandbox, on pourra toujours en reparler en fonction des resultats de ce test... :wink:
 
WRInaute passionné
moi je suis en train de suivre un site de marketing viral (pas transatlantys :wink: ) dont le buzz fait qu'il est linké un peu de partout en ce moment ce qui correspond à une évolution naturel des liens et l'amène pour l'instant à une progression constante sur une requête à 70 millions de réponses et 8 adwords. Je suis curieux de voir si ce site va subir ou non l'effet sandbox.
 
WRInaute passionné
Hum! tom sawyer!

Ta remarque est interessante, mais le but de ce fil est de monter un test sur l'effet sandbox. Si cela t'interesse, fait nous par de tes commentaire sur la description du test! :wink:
 
Olivier Duffez (admin)
Membre du personnel
fandecine, bravo pour ton initiative. Je veux bien essayer de t'aider dans ton test ; par exemple si tu veux fournir des infos uniquement aux membres connectés de WRI, je peux le faire dans une page spéciale de MyWRI.

je peux aussi fournir quelques infos statistiques via MyWRI (cela concerne les "parametres liés au site".

concernant l'histoire du sandbox sur certaines requêtes, ça me semble un peu compliqué à analyser. comment déterminez-vous si vous êtes sandboxé ? qui plus est sandboxé pour une requête précise ? si c'est parce que vous êtes mal positionné, ou pas aussi bien que vous le souhaiteriez, alors OK je comprends ce que vous appelez le sandbox :)
 
WRInaute passionné
Tout le test repose en fait sur l'utilsation du /******* dans les requettes google. En fait je tatonne un peu mais je pense qu'en recoupant les infos reccueillies, on pourra un idée plus claire du pourquois et du comment de l'effet sandbox et peut-être arriver à definir des régles pour l'eviter ou le limiter.

J'ai presque termine l'espace de saisie des données.

Je vous tien au courant...
 
WRInaute passionné
Tout le test repose en fait sur l'utilsation du /*******

J'ai pour ma part également essayé avec des requête à accent avec lesquels pour mon cas, je retrouvais le même résultat avec 38* qu'avec avec un accent sur ma requête qui normalement n'en contient pas.

je m'explique : sur "cart_ de fidé_ité" j'etait noyé dans le classement mais 1er
avec : cart_ de fidé_ité /*****38 fois
avec : càrt_ de fidé_ité

(Je pense qu'avec un accent cette requête ne devient plus concurentielle et donc pas de filtre appliqué)

comment déterminez-vous si vous êtes sandboxé ? qui plus est sandboxé pour une requête précise ?

1) le test des ****
2) l'evolution du positionnement (brusque dégringolade)
3) avec des accents (peut-être pas significatif mais il faudrait voir a plus grande echelle)
4) parce que ggogle ne nous ammene pas beaucoup de visiteurs :wink: (ça c'est histoire de se justifier)
 
WRInaute passionné
Moi je propose dans les tests de provoquer une augmentation rapide du nombre de bl (avec l'appui des webmasters içi) avec anchor text identique pour étudier la rentrée en sandbox sur une expression puis dans un deuxième temps retirer tous ces liens pour étudier la possibilité de forcer la sortie de sandbox.

Ce que je disais plus haut n'est pas en contradiction avec ce test sur la sandox au contraire : j'étudie la possibilité pour un site connaissant un buzz rapide et donc une croissance de liens exponentielle et naturelle de ne pas tomber dans la sandbox contrairement à des sites ultra optimisés dont on va forcer la populaité par des echanges de lien et des inscriptions dans les annuaires.


comment déterminez-vous si vous êtes sandboxé ? qui plus est sandboxé pour une requête précise ?

Pour moi il s'agit d'une chute brutale du positionnement sur des expressions ciblées après une progression constante
 
WRInaute passionné
Moi ce qui m'intrigue c'est /********

Sur un mot clés je ne suis pas dans le top 100, si je rajoute /et 50* je me retrouve premier!!!!

C'est un peu tout cela que je veux eclaircir avec ce test et de la patience...
 
WRInaute passionné
Moi je propose dans les tests de provoquer une augmentation rapide du nombre de bl (avec l'appui des webmasters içi)

Simultanément, je propose de faire un test

- sans backlinks (ou très peu) mais sur une page optimisée pour une requête concurentielle.

- sans BL (ou très peu) sur une page optimisé pour un mot inventé

Et j'ajoute, on devrait le faire sur "UNE PAGE IDENTIQUE" en changeant uniquement le mot requête !

Sur un site jeune et sur un site ancien
 
WRInaute passionné
CA Y EST!

J'ai fini l'interface de saisie des données necessaires pour notre test. Les membres qui souhaitent participer au test me contactent par MP que je leur envoie l'url et un code d'accés.

Maintenant, j'ai besoin de vous pour envisager comment on peut relier ces données!

En mesure que nous aurons des analyses, nous les publierons sur WRI!
 
WRInaute impliqué
WebRankInfo a dit:
par exemple si tu veux fournir des infos uniquement aux membres connectés de WRI, je peux le faire dans une page spéciale de MyWRI.
Bon tu offres l'espace, tu as les données. les commentaires, quelques pistes, idées, farfelues, ... mais tout le monde regarde, essaye de comprendre, laisse le forum se faire.
fandecine a dit:
Moi ce qui m'intrigue c'est /********
oli004 a dit:
J'ai pour ma part également essayé avec des requête à accent
fredax a dit:
ocsima a dit:
Regardez -http://testetessai.neuf.fr
Et regardez les résultats de https://www.google.fr/search?hl=fr&newwi ... word&meta=
rituel a dit:
Erazor, DJ_... (je n'ai pas son avatar sous les yeux) et il y en a plein d'autres qui participent à la valeur de ton forum
 
WRInaute impliqué
fandecine a dit:
En mesure que nous aurons des analyses, nous les publierons sur WRI!
Oui! en complément de mon post précédent

[Edit]Bien qu'étant 'amateur', la démarche et les résultats des tests m'intéressent
Je ne subis qu'un petit déclassement si je regarde une étoile.[/Edit]
 
WRInaute passionné
juste une petite remarque pour ceux qui ont commencé à utiliser l'interface de saisie:

je n'ai pas prévu de fonction pour editer les données saisie (pour eviter les traficotage) beuh! non, je suis pas parano! mais rigoureux! :wink:

Alors faites attention et verifiez vos formulaites avent de valider!
 
WRInaute passionné
Bon, un petit problème pour les matheux!

Je voudrait créer un indice de difficultée de positionnement sur un mot clé en prennant en compte:
  • le nombre total de pages référencées par GG
  • le nombre de reponses GG sur ce mot clés
  • le nombre des pages du site étudier sur la requette "mot_cle + inurl:domaine-etudié"

Peut être faudrait t-il ajouter aussi le PR moyen des 20 premières response de GG?

Qui s'y colle? :wink:
 
WRInaute passionné
juste une petite remarque pour ceux qui ont commencé à utiliser l'interface de saisie

j'ai du inaugurer ça hier après toi :wink:

je n'ai pas prévu de fonction pour editer les données saisie (pour eviter les traficotage) beuh! non, je suis pas parano! mais rigoureux!

Je voulais te repondre en MP, mais je pense que par le forum ce sera plus constructif.
Sur les deux requêtes que j'ai renseigné hier soir, j'ai indiqué les date de première indexation. Je ne me suis rendu compte qu'après avoir regardé sur les données que tu avais entré qu'il s'agissais de la date de la saisie (ce qui est logique pour voir une evolution)
Malheureusement je n'ai pas pu corriger, car comme tu l'a précisé : "pas prévu de fonction pour editer les données saisie"
Ceci dit, j'ai voulu ressaisir la même requête avec la date du jour et là, plantage, la page restait sans ajouter les données de la requête avec la nouvelle date. Donc, il y a peut etre un petit bug à ce niveau.
 
WRInaute passionné
Je voudrait créer un indice de difficultée de positionnement sur un mot clé en prennant en compte:

Et quelque chose du style pourcentage du site concerné par rapport au nombre de réponse.

exemple :
* Un site A, avec "mot_cle + inurl:domaine-etudié" donne 50 pages
* La requête "mot_cle" retourne 300 000 réponses

on a donc pour le site A
300000/50= 6000
1/6000= 0.0001666666
soit 0.016 %

Le site A comprend 0.016% des réponses proposées pour une requête "mot_cle"

* Un site B, avec "mot_nouveau + inurl:domaine-etudié" donne 18 pages
* La requête "mot_nouveau" retourne 500 réponses

on a donc pour le site A
500/18= 27.777777
1/27.777777= 0.036
soit 3.6 %

Le site B comprend 3.6% des réponses proposées pour une requête "mot_nouveau"
 
WRInaute passionné
Avant de vous communiquer mes premières observations liées à ce test, je souhaite exprimer ma déception quant au manque d'implication des Wrinautes dans ce test. C'est vrai, qu'il est plus facile de se plaindre de l'effet sandbox que d'essayer de le comprendre et le mesurer. :twisted: Je ferme la parenthèse.

Voici donc deux mois que je fais tout un tas de mesure de positionnement afin de percer les secrets de la GG Sandbox. Tout d'abord, je pense qu'il est souhaitable de faire un petit peu le point des connaissances à ce sujet car on entend parfois tout et n'importe quoi:

1 - L'effet sandbox n'affecte pas un site mais certaines requêtes par rapport à un site.
2 - L'effet sandbox est dépendant de l'age du site (c'est désormais une quasi-certitude)
3 - L'effet sandbox est temporaire et d'une durée estimée de 6 à 8 mois (mais on manque d'analyses sérieuses à ce sujet)
4 - Il semblerait que l'effet sandbox soit accentué par une croissance trop importante des BL (vue que GG affiche maintenant un peu n'importe quoi en matière de décompte des BL, il sera très difficile de confirmer ce point)
5 - La durée de dépôt du NDD semble atténuer l'effet sandbox (piste donnée par Googleguy)
6 - La suppression de l'effet sandbox est soudaine et apparemment liée à un événement global chez Google (on parle souvent de la mise à jour du GG directory).

Revenons au test. Me retrouvant seul, j'ai quelque peu limité les données observées, que je résume ici:
1 - évolution des BL (bien que de moins en moins significatif)
2 - évolution du nombre de pages indexées
3 - suivi de la position sur un mot clés sur google france sans filtre, avec filtre /+40* (sur toutes les observations que j'ai faites, 39* est un seuil après lequel les positions sont radicalement différentes), et résultat avec allinanchor (seomoz accorde beaucoup de poids à ce paramètre dans son outil de mesure de l'effet sandbox)

Depuis le debout juillet, je focalise mon test sur le site de mon profil car mis en ligne en janvier (si la durée de 6 à 8 mois est vérifier) je devrais assister en direct à une sortie de sandbox. Le test porte sur 8 requêtes.

Observations: (ne rêvez pas! je vais pas vous pondre une formule magique! :wink: )

Le nombre de pages indexées par GG augmente régulièrement (avec quelques a coups) depuis le 6 juin (de 37000 à 43000 pages).

Sur quatre requêtes, la position évolue lentement!
- requête 1: 176 eme le 6 juin - 62 eme le 30 juillet
- requête 2: 37 eme le 6 juin - 7 eme le 30 juillet
- requête 3: 285 eme le 6 juin - 8 eme le 30 juillet
- requête 4: 385 eme le 6 juin - 239 eme le 30 juillet
Sur trois autres requêtes, la position est aléatoire:
- requête 5: apparaît tantôt entre 180 et 200, puis disparaît complètement (parfois, sur prés d'un million de résultats, GG n'affiche que les 2 ou 300 premiers)
- requête 6: apparaît, disparaît, apparaît...
- requête 7 (c'est la requête 6 au pluriel): apparaît, disparaît, apparaît... mais pas de façon synchrone avec la requête 6.

La dernière requête ne fait pas apparaître le site dans les 500 premiers résultats. C'est pourtant la plus importante pour le site (dans url, dans la thématique du site, dans les encres etc...) et elle donne plus de 39 millions de résultats.

pour les requêtes 1,2,3,5 le site apparaît dans les 10 premiers résultats avec filtre 40*, dans les 30 premiers pour les requêtes 4,6 et 7 et dans les 50 premiers résultats pour la requête 8.

Il faut noter que pour toutes les requêtes, la position avec filtre 40* et allinanchor est restée très stable (variation de 4 ou 5 places même pour les requêtes 5,6 et 7) et que le résultat avec filtre 40* ou allinanchor sont très très proches (4 ou places d'écart).

La position sur une requête varie d'autant moins vite qu'elle est proche de la position avec filtre ou allinanchor.

Autre chose importante la GG danse de juillet, n'a pour l'instant pas modifier l'évolution des positions.

Par contre la mise à jour des BL de mi-juin c'est ressenti sur les requêtes 1 et 2 avec un passage brutal de 133 à 74 pour la requête 1 et de 97 à 19 pour la 2, positions confirmées par la suite.

Il semble que le site soit sandboxé sur les requêtes 6,7,8 et à un moindre degrés sur la requête 5.

J'ai remarqué une corrélation frappante entre la position avec filtre 40* et allinanchor.

J'ai également noté que les 20 premiers résultats étaient des sites beaucoup plus vieux que le mien, ce qui n'est plus vrais avec les filtres.

Voila! Je vous laisse tirer vos premières conclusions, pour ma part, j'attends encore un peu. (la mise à jour du GG directory).
 
Olivier Duffez (admin)
Membre du personnel
Merci fandecine pour ta contribution très intéressante.

j'ai pas saisi sur quels critères tu te bases pour dire si ton site est sandboxé pour une requête particulière. Par exemple pourquoi ton site ne serait pas sandboxé pour les requêtes 1 à 5 ?

N'ayant pas assez suivi les discussions et les tests avec les fameuses 40*, j'aimerais savoir si ceux qui ont vu un de leurs sites sortir brusquement du sandbox ont remarqué que leurs positionnements sont devenus identiques à ceux qu'ils avaient en utilisant le filtre 40* (quand ils étaient sandboxés).

dit autrement : le filtre 40* permet-il vraiment de "désandboxer virtuellement" un site ?

Olivier
 
WRInaute passionné
WebRankInfo a dit:
j'ai pas saisi sur quels critères tu te bases pour dire si ton site est sandboxé pour une requête particulière. Par exemple pourquoi ton site ne serait pas sandboxé pour les requêtes 1 à 5 ?

Pour les requêtes 1 et 4, ma position évolue lentement, comme on peut s'y attendre lorsque l'on travaille le référencement d'un site. Je pense que le processus est normal. Pour les requêtes 2 et 3, je suis sur la première page, donc je ne pense pas être sandboxé.

J'observe que l'évolution de la position tend à rejoindre la position avec filtre 40*. Mon hypothèse est effectivement que c'est la position réelle sans filtre sandbox. De plus, plus on s'approche de cette position, plus la progression ralentie (effet de courbe avec asymptote).

En fait, la requête que je suis plus particulièrement c'est la 8 (cinéma pour ne rien te cacher :wink: ), car c'est celle qui semble atteinte par tous les symptômes de l'effet sandbox (beaucoup de résultats, sites très ancien dans le domaine, écart extrême entre position avec et sans filtre). Le problème, c'est que je suis beaucoup trop loin pour faire des mesures...
 
WRInaute impliqué
je vais essayer de contribuer un peu à ton étude.

tout d'abord je suis d'accord avec toi sur ceci :
- le désandboxage se fait par paliers (vécu sur pas mal de sites).
- le degré de sandbox est proportionnel au niveau de concurrence de la requete (attention je n'ai pas dit du nb de résultats).
- la durée de sandbox varie pour la plupart de 2 mois à 8 mois.
- les requetes avec /* et les allinanchor permettent en effet de voir si on est sandboxé (suppression du filtre) mais ne donne pas la position exacte lors de la sortie car toutes les données ne sont pas traitées en même temps.

là où je ne suis pas d'accord :
- l'âge du site n'a aucun rapport, j'ai fait des tests sur de vieux sites et les pages sont aussi sanboxées quelques fois.
- la durée du dépot de NDD n'est pas un facteur important.

mes doutes :
- pour l'instant je n'ai jamais vu personne sortir de la sandbox de manière volontaire, souvent de pures coincidences.
- on dirait que la date de sandboxage est proportionnelle à la requete et qu'elle est fixée dès le départ.

une certitude : la sandbox est le résultat d'une multitude et d'un croisement de critères, c'est pour cela qu'il est si difficile à analyser.

Fandecine, je suis partante pour continuer avec toi cette analyse et essayer de faire d'autres tests si tu veux.
caro
 
WRInaute passionné
caro a dit:
là où je ne suis pas d'accord :
- l'âge du site n'a aucun rapport, j'ai fait des tests sur de vieux sites et les pages sont aussi sanboxées quelques fois.
- la durée du dépot de NDD n'est pas un facteur important.

J'avoue ne pas avoir assez de recul pour confirmer ou infirmer ces deux points. Je me base cependant sur les dires de GoogleGuy et le fait que les outils d'analyse et de mesure de l'effet sandbox utilisent la date de mise en ligne du site comme paramètre dans leur calcul.

De plus, si on reflechit au but poursuivi par Google, c'est à dire attendre de voir si le site évolue pour éliminer les sites "kleenex", il m'apparaît justifié que l'âge du site (voir la durée de dépôt du NDD) soient des paramètres possibles dans le calcul disons de la taille du bac à sable.

Dés que je retrouve la source des mes affirmations, je met un lien dessus.
 
Olivier Duffez (admin)
Membre du personnel
pour tenter de faire avancer le schmilblick... quelques questions parachutées (aujourd'hui j'ai décidé de poser des questions ;-) ) :
D'après vous,
1- un site peut-il "tomber dans la sandbox" alors qu'il n'est pas récent (depuis plus d'1 an dans Google par exemple) et qu'il avait de bons positionnements ?

2- êtes-vous sûrs que cela s'applique pour certains mots-clés seulement et pas pour d'autres ? J'ai en effet l'impression que l'effet est global, mais que la chute de positionnement se voit peut-être davantage sur certaines requêtes concurrentielles

3- on parle souvent de l'accroissement des backlinks, qui peut être néfaste s'il est trop soudain et important. Pensez-vous qu'il puisse y avoir la même chose avec le nombre de pages du site ? (un ajout soudain de milliers de pages pourrait être pénalisant car louche ?)

Olivier
 
WRInaute passionné
perti a dit:
fandecine a dit:
J'ai remarqué une corrélation frappante entre la position avec filtre 40* et allinanchor.
Que veux tu dire par là ?

J'ai simplement noté, sur plus de 500 mesures, que la position donnée par allinanchor: mots cles est trés proche de celle donnée par mots cles /***...*** (avec 40*).

WebRankInfo a dit:
pour tenter de faire avancer le schmilblick... quelques questions parachutées (aujourd'hui j'ai décidé de poser des questions ;-) )

c'est le monde à l'envers! :wink:
WebRankInfo a dit:
2- êtes-vous sûrs que cela s'applique pour certains mots-clés seulement et pas pour d'autres ? J'ai en effet l'impression que l'effet est global, mais que la chute de positionnement se voit peut-être davantage sur certaines requêtes concurrentielles
Peut-on réellemnt parler de sandbox lorsque l'on sort dans le top 10 sur une requête qui renvoie 7 ou 800.000 resultats!? La question est là. Et pour répondre, il faut peut-être attendre de sortir de la sandbox pour voir si même dans ce cas il y a amelioration de la position.

WebRankInfo a dit:
3- on parle souvent de l'accroissement des backlinks, qui peut être néfaste s'il est trop soudain et important. Pensez-vous qu'il puisse y avoir la même chose avec le nombre de pages du site ? (un ajout soudain de milliers de pages pourrait être pénalisant car louche ?)
Le site sur lequel je fais les tests est né avec environ 35000 pages, mais il a fallut plusieurs semaines pour qu'elles soient indéxées. Dans quelle mesure GG connaît-il le nombre de pages d'un site lors des premier crawl?

Quoiqu'il en soit, pour évaluer le phénomène on en revient au même point: il faut observer plusieurs sites, différents par leur taille et leur age et cela sur une durée qui se compte en mois!
 
WRInaute accro
pour tenter de faire avancer le schmilblick... quelques questions parachutées (aujourd'hui j'ai décidé de poser des questions ;-) ) :
D'après vous,
1- un site peut-il "tomber dans la sandbox" alors qu'il n'est pas récent (depuis plus d'1 an dans Google par exemple) et qu'il avait de bons positionnements ?

Je ne l´ai jamais constaté sauf si on considère le phénomène Bourbon du mois de juin comme une forme de sandbox. J´ai toujours constaté le sandbox sur des nouveaux sites et plus jamais sur des anciens sites.

2- êtes-vous sûrs que cela s'applique pour certains mots-clés seulement et pas pour d'autres ? J'ai en effet l'impression que l'effet est global, mais que la chute de positionnement se voit peut-être davantage sur certaines requêtes concurrentielles

Difficile de dire si une "requete" est touchée par le phénomène sandbox dans une moindre mesure ou si elle n´est pas du tout touchée mais "moyennement" référencée. En temps de sandbox sur des nouveaux sites j´ai constaté que 99.5% des requetes me placait au dela de la 200eme place (je ne cherche pas plus loin, donc c est peutetre meme pire!!) mais que j´avais tout de meme quelques requetes en 3eme ou 4 eme page, d´autres en 10eme page et parfois une requete ou deux (très spécifique >> la notion de requete "concurrentielle" me parait intéressante...) en 1ere page.
 
WRInaute passionné
WebRankInfo a dit:
2- êtes-vous sûrs que cela s'applique pour certains mots-clés seulement et pas pour d'autres ? J'ai en effet l'impression que l'effet est global, mais que la chute de positionnement se voit peut-être davantage sur certaines requêtes concurrentielles

OUI

petit exemple sur le site de mon profil :

requête f*dél*té position : 7 ème sur 820 000 depuis quelques jours après indexation de mon site. (rq : quelques adwords en liens commerciaux)

requête c@rte de f*dél*té position : 30 ème sur 370 000 depuis sortie partielle et brutale de sandbox 5 mois après indexation du site (rq : beaucoup plus de liens commerciaux)

curieux non !? :roll:
 
WRInaute accro
Tu parles du meme site pour ces deux requetes ? car tu dis "depuis quelques jours apres indexation" et après "5 mois apres indexation"......

il faudrait avoir un exemple avec deux requetes (une avec sandbox et l´autre non pour un meme site)
 
WRInaute passionné
Affirmatif, je parle du même site pour les deux requêtes sitées !

d'ou mon intime conviction que la pénalisation est sélective sur une requête et en fonction notament de son niveau de concurence.

Comme je le précisais dans un topic précédent dattant de quelques mois.

il faudrait avoir un exemple avec deux requetes (une avec sandbox et l´autre non pour un meme site)

c'est mon cas.
 
WRInaute accro
Oui, mais 30eme et 7eme... il est ou le sandbox ??? je ne comprends pas. je vois les deux requetes dans le meme cas de figure là. j´ai loupé un truc ?

Ou veux tu dire que tu a été tout de suite 7eme sur la premiere requete et que tu n est devenu 30eme que 5 mois après (donc je présume pendant ces 5 mois tu étais introuvable) sur la deuxieme requete ?

c est ca ?
 
WRInaute passionné
oui, c'est ça. Sorry, je pensais avoir été suffisament explicite dans mon précédent post :oops:

Donc je résume :

ma premiere requete : aucune pénalisation, puisque 7 ème dès le début
ma seconde requete : dans le sable pendant 5 mois et paf, parachuté 30 ème.
 
WRInaute accro
As-tu essayé de voir :

- combine y a t-il d´encart adwords sur chaque expressions ?
- combien de résultats sur chaque expression ?
- combien de recherches effectueée sur overture et espotting pour ces deux expressions (générateur de mots clés) ?

tu nous donnes ca pour voir ?
a+
 
WRInaute accro
fandecine a dit:
WebRankInfo a dit:
3- on parle souvent de l'accroissement des backlinks, qui peut être néfaste s'il est trop soudain et important. Pensez-vous qu'il puisse y avoir la même chose avec le nombre de pages du site ? (un ajout soudain de milliers de pages pourrait être pénalisant car louche ?)
Le site sur lequel je fais les tests est né avec environ 35000 pages, mais il a fallut plusieurs semaines pour qu'elles soient indéxées. Dans quelle mesure GG connaît-il le nombre de pages d'un site lors des premier crawl?
je suis assez d'accord avec toi ... comme j'ai déjà eu l'occasion de le dire, je pense que Google a développé une sorte d'instrument de mesure de pertinence (d'une page par rapport à une requete) ... qui, comme tout instrument de mesure qui se respecte, se doit d'être non intrusif pour ne pas fausser les mesures ... or, la meilleure compréhension du fonctionnement des algorithmes de classement par certains leur ont permis de fausser la mesure à leur profit ...

Google, pourrait donc avoir décidé de doter son instrument de mesure de filtres destiner à éliminer les points jugés "anormaux", en les revoyant au fin fond du classement (effet sandbox ?) ...

je ne crois pas que le nombre de page d'un site (ni la manière de les mettre en ligne) soit un critère de pertinence ... par contre les BL sont le fondement même de l'algorithme, et je suis convaincue que Google analyse tout à leur sujet : nbre de BL, origine des BL (domaines, IP et thématiques), textes des BL, évolution dans le temps (dérivée voire dérivée seconde), réciprocité des BL, etc ... et ce quel que soit l'age du site ... :wink:
 
WRInaute passionné
J'ai retrouvé un article qui avait inspirré mon test http://www.seomoz.org/articles/google-s ... alysis.php

Dans cet article, outre certaines des hypothéses que je reprends, on peut noter qu'un moyen de determiner si un site est sandboxé sur un mot clé, on compare les resutats de GG avec d'autres moteurs.

sur la requête bandes annonces je suis:

4 sur Yahoo , 7 sur MSN, et dans les choux sur GG. donc on peut considerer que mon site est sandboxé sur cette requête.

sur la requête jaquettes films je suis:

2 sur Yahoo , 2 sur MSN, et 8 sur GG. donc on peut considerer que mon site n'est pas sandboxé sur cette requête.

Donc en réponse à olivier, l'effet sandbox ne semble pas toucher un site mais bien des requettes par rapport à un site.

Autre remarque à noter par rapport à cet article, plutôt que de parler de l'age d'un site, ils semble dire que les sites antérieurs à 2003 ne sont pas touchés!
 
WRInaute accro
tu peux essayer de nous donner les infos que je demandais un peu plus haut ? nombre d adwords, nombre de resultats et nombre de requete espoting et overture pour les deux expressions ?
 
WRInaute passionné
à HerveG:

bandes annonces: espotting=0, Adwords=1, overture=0
jaquettes films: espotting=0, adwords=1, overture=2

nbre de resultats:

bandes annonces:

GG: 899000
MSN: 222803
YAHOO: 8520000

jaquettes films:

GG: 277000
MSN: 41420
YAHOO: 596000
 
WRInaute impliqué
WebRankInfo a dit:
1- un site peut-il "tomber dans la sandbox" alors qu'il n'est pas récent (depuis plus d'1 an dans Google par exemple) et qu'il avait de bons positionnements ?
Tout à fait, les membres de ce forum pourront le confirmer, un vieux site peut tout à fait passer dans la sandbox pendant une période.(voir la réponse suivante pour plus de précision)

WebRankInfo a dit:
2- êtes-vous sûrs que cela s'applique pour certains mots-clés seulement et pas pour d'autres ? J'ai en effet l'impression que l'effet est global, mais que la chute de positionnement se voit peut-être davantage sur certaines requêtes concurrentielles
Je pensais comme toi au départ mais il s'avère qu'après pas mal d'analyse je pourrais en déduire ceci :
- pour un site récent, tu as raison c'est l'ensemble du site qui est sandboxé (à différents degrés selon la requete bien sûr, c'est une notion importante de la sandbox, le degré de sandboxage).
- pour un site ancien, seulement quelques pages peuvent être sandboxées, en effet essayez sur certains sites de vous placer sur "vetements" ou "voyages", des requetes très concurrentielles, vous allez employer de gros moyens, et bien cette page va peut être tomber dans la sandbox et seulement cette page.
Je n'ai pas pu faire ce test sur des milliers de sites mais sur une dizaine et c'est 100% ce qui s'est passé.
Sur un vieux site, il s'agit d'un sandboxage sélectif.

WebRankInfo a dit:
3- on parle souvent de l'accroissement des backlinks, qui peut être néfaste s'il est trop soudain et important. Pensez-vous qu'il puisse y avoir la même chose avec le nombre de pages du site ? (un ajout soudain de milliers de pages pourrait être pénalisant car louche ?)
Le fait d'augmenter trop brusquement le nombre de BL est considéré comme un facteur déclencheur de sandbox, je le pense aussi.
Le fait d'augmenter brusquement le nombre de pages peut aussi être un déclencheur pour cette raison, google analyse le thème du site, le fait d'augmenter vivement le nb de pages ou bien de changer la structure d'un trop grand nb de pages est louche pour google, car le site pourrait donc changer radicalement de thème.
D'ailleurs pas mal de membres ont déjà connu ce phénomène, changer trop de pages d'un coup et google désindexe tout le site, pour le réindexer plus tard, ceci afin de se protéger contre un changement radical du thème du site.
 
WRInaute passionné
Sujet à réflexion pour ceux qui pensent que l'age du site n'est pas un critère de sandbox, je vous livre l'age des 20 premiers resultats de GG sur la requette bandes annonces (je rapelle que mon site date de janvier 2005)

1. -http://www.1001ba.com/1001ba/bann.html 04-2000
2. -http://fr.movies.yahoo.com/films/video.html 10-1996
3. -http://cf.dir.yahoo.com/Art_et_culture/Cinema/D 10-1996
4. -http://www.1000films.com/ 05-2001
5. -http://ba.6nema.com/ 08-2000
6. -http://www.bandes-annonces.com/ 02-2000
7. -http://www.allocine.fr/video/ 04-1997
8. -http://www.cinefil.com/cinema/cinefil.cfm?lesba 10-1997
9. -http://www.tv5.org/TV5Site/cinema/fs_ba.php 01-1998
10. -http://www.ecranlarge.com/bandes_annonces.php 09-2004
11. -http://cannes.telerama.fr/cannes2005/les_bandes 05-2002
12. -http://www.foxfrance.com/trailers/ 08-2000
13. -http://tempsforts.france5.fr/ ND
14. -http://www.cinopsis.com/trailers.cfm?lang=fr 12-1996
15. -http://www.apple.com/trailers/ 10-1996
16. -http://www.nowrunning.com/trailers/trailer.asp? 06-2002
17. -http://www.tvmag.com/jsp/video/annonce.jspx 10-1999
18. -http://www.commeaucinema.com/news.php3?nominfos 08-2000
19. -http://www.cinemamontreal.com/cm/que/Montreal-b 12-1998
20. -http://www.cinenews.be/Movies.Trailers.Now.cfm? 02-2004

Je vous laisse méditer ces résultats!
 
WRInaute passionné
caro a dit:
Je pensais comme toi au départ mais il s'avère qu'après pas mal d'analyse je pourrais en déduire ceci :
- pour un site récent, tu as raison c'est l'ensemble du site qui est sandboxé (à différents degrés selon la requete bien sûr, c'est une notion importante de la sandbox, le degré de sandboxage).
- pour un site ancien, seulement quelques pages peuvent être sandboxées, en effet essayez sur certains sites de vous placer sur "vetements" ou "voyages", des requetes très concurrentielles, vous allez employer de gros moyens, et bien cette page va peut être tomber dans la sandbox et seulement cette page.
Je n'ai pas pu faire ce test sur des milliers de sites mais sur une dizaine et c'est 100% ce qui s'est passé.
Sur un vieux site, il s'agit d'un sandboxage sélectif.
caro a dit:
Le fait d'augmenter trop brusquement le nombre de BL est considéré comme un facteur déclencheur de sandbox, je le pense aussi.
Je suis d'accord avec ça, même si je ne suis pas persuadé qu'il s'agisse des même filtres.
J'ai testé pour vous : Un site jeune + trop de baclinks artificiels = sandbox sur l'ensemble du site
 
WRInaute accro
caro a dit:
Le fait d'augmenter brusquement le nombre de pages peut aussi être un déclencheur pour cette raison, google analyse le thème du site, le fait d'augmenter vivement le nb de pages ou bien de changer la structure d'un trop grand nb de pages est louche pour google, car le site pourrait donc changer radicalement de thème.
je ne vois vraiment pas ce qu'il y a de "louche" à augmenter (ou diminuer d'ailleurs) brusquement le nombre de pages et/ou à faire des modifications (même profondes) à un site ... tous les sites font régulièrement des "lifting" sans être pénalisés (heureusement) ... :wink:
 
WRInaute passionné
fandecine a dit:
Sujet à réflexion pour ceux qui pensent que l'age du site n'est pas un critère de sandbox, je vous livre l'age des 20 premiers resultats de GG sur la requette bandes annonces (je rapelle que mon site date de janvier 2005)

Je crois aussi que GG a fortement intégré l'age des sites et/ou pages et/ou liens dans son algotithme de classement.
J'ai vu des sites fantômes, avec assez peu de backlinks (mais des backlinks anciens eux-aussi) arborer un joli PR5.
Je sait, ça fait pas le référencement. Ces sites n'étaient d'ailleurs pas du tout optimisés et mal classés.

Je crois que Google a intégré un indice de confiance au classement des pages qu'il indexe. Les 1ers critères mis en place sont des critères basés sur l'ancienneté.
 
WRInaute passionné
1- un site peut-il "tomber dans la sandbox" alors qu'il n'est pas récent (depuis plus d'1 an dans Google par exemple) et qu'il avait de bons positionnements ?

Je l'ai constaté également pour un site ancien et bien placé sur certaines requêtes après avoir redéfini la cible et avoir travaillé l'optimisation de certaines pages (on-page et off-page) notamment l'index que ces pages sont tombées en sandbox.
Mes analyses concernant la sandbox confirme l'importance d'une augmentation importante de bl comme facteur déclencheur mais aussi l'analyse de l'anchor des bl pour déterminer les requêtes sandboxées
 
WRInaute impliqué
bref résumé de ce que l'on pense savoir :

1) quels sont les critères qui font tomber en sandbox :
- brusque augmentation des BL
- trop de BL avec les mêmes anchor obtenu d'un coup
- rapport nombre de BL standards / BL annuaires
- participation à une farmlink ou à une toile de BL
- brusque augmentation du nb de page
- changements importants dans beaucoup de pages
- changement de thème d'une page (sandbox sélective)

2) les degrés de sandbox :
- c'est une notion très importante, souvent on croit qu'on est sandboxé que sur quelques requetes mais en fait on ne voit pas trop les conséquences sur les autres pages car le degré est faible.
- le degré est proportionnel au niveau de concurrence (attention aucun rapport avec le nb de résultats).
- à partir d'un certain nombre de pages sandboxées le site est entièrement sandboxé dans sa globalité.

3) site ancien et site récent
- tous les sites peuvent être sandboxés
- un site récent est quasiment sûr d'être sandboxé dans sa globalité, à cause du nb de pages qui seront de suite sandboxé
- un site ancien peut n'avoir que quelques pages de sandboxées
- il faut raisonner pas en "site" mais en terme de "nouvelles pages" découvertes par google. la sandbox s'applique ou pas selon certains critères à toutes les nouvelles pages !

4) durée de la sandbox :
- la durée est fixée à une date précise pour une période donnée
- google revoit le degré de sandbox et la période tous les x (je dirais 1 fois tous les 2 mois environs d'après les posts que je vois sur wri, c'est par vague que google reanalyse les sites, comme pour le PR)
- peut on influencer sur une sortie de sandbox ? oui, si on agit directement sur les facteurs déclencheurs, après il faut un certain temps pour la prise en compte par google et ensuite attendre la prochaine "analyse sandbox" de google.


Voilà quelques éléments qui pourront aider certaines personnes, cependant il est très difficile de ne pas passer dans la sandbox pour un site récent. Il faut soit décoller doucement soit mettre vraiment le paquet afin de passer au travers.

A vous de compléter ces infos afin de continuer à avancer.
caro
 
WRInaute impliqué
Cendrillon a dit:
je ne vois vraiment pas ce qu'il y a de "louche" à augmenter (ou diminuer d'ailleurs) brusquement le nombre de pages et/ou à faire des modifications (même profondes) à un site ... tous les sites font régulièrement des "lifting" sans être pénalisés (heureusement) ... :wink:

attention Cendrillon, il y a une différence entre faire un lifting et changer le contenu.
je te déconseille fortement de changer plus de 30 à 50 % des contenus de tes pages, ton site sera désindexé pour être considéré comme étant un nouveau site, cela parait normal pour se protéger du spam.
 
WRInaute accro
caro a dit:
- brusque augmentation du nb de page
toujours pas d'accord avec ça ... :lol:
d'ailleurs que s'est il passé Olivier, quand tu as ajouté l'annuaire WRI au dicodunet (soit plus de 30 000 pages d'un coup) ...

caro a dit:
- changements importants dans beaucoup de pages
- changement de thème d'une page (sandbox sélective)
désolée mais avec ça non plus ... si tu fait des changement importants ou si tu changes de thème ta page ... tu vas changer le positionnement de cette page (les textes de liens et/ou les thematiques des pages qui font les liens seront moins bien adaptés) ... et tu peux (ou vas si tu étais bien positionnée) régresser dans les résultats mais on ne peut pas appeler cela être "sandboxé" (en tout pas au sens d'une pénalisation) ... :wink:

sinon je suis à peu près d'accord avec le reste ... :wink:

[edit] tu as posté pendant que j'écrivais ...
caro a dit:
je te déconseille fortement de changer plus de 30 à 50 % des contenus de tes pages, ton site sera désindexé pour être considéré comme étant un nouveau site, cela parait normal pour se protéger du spam.
c'est vrai, ça peut arriver, mais ça n'a rien à voir avec l'effet sandbox" ...
 
WRInaute impliqué
je suis prête à faire une concession :lol:
je t'accorde que pour l'augmentation du nombre de pages je ne peux pas le prouver, par contre si tu as un site de 100 pages et que tu changes le contenu de plus de 40 ou 50 pages et bien ton site sera entièrement revu par google et tu as 90% de chance pour qu'il soit désindexé puis réindexé et pour tomber dans la sandbox. google va de ce fait pouvoir reclasser ton site dans un thème précis.
de toute facon on va pas se facher :wink:
 
Nouveau WRInaute
Je rajouterai duplicate content ! Ca parait évident mais j'ai pas fais gaffe sur mes premiers sites. J'ai oublié le petit icone pour imprimer l'article, petit icone qui est un lien vers mon contenu avec une feuille de style light.
J'ai fait un bel Url Rewriting mais pas sur les liens d'impression . :(

Après quelques mois à me dire que je ferrai bien par sortir de la fameuse "sandbox" sans voir pourquoi j'y étais entré. Juste qu'au jour où j'ai fait un nouveau site sans mes icones et là surprise 40ème sur 1 million de requètes en 1mois. Je compare mes sites et je comprends subitement que je viens de faire une grosse boulette 8O .

Je vire l'icone de "mon désoeuvrement" et 15 jours après paf 28eme sur Yahoo! où j'étais la aussi "sandboxé" logique pour ce type d'erreur.
Bilan sur "streaming" (1mois après correction) :
Google : null part
Yahoo : 28eme place très honnête vu la concurrence
MSN : 1er :roll: comme tout mes sites d'ailleurs (je planche pour un défaut du moteur :lol: )

Bref tout ça pour dire que la suroptimisation, ou le grand nombre de backlink n'est pas l'unique cause. La preuve une erreur de débutant lors d'un passage à l'URL Rewriting m'a mis bien profond dedans. Je n'ai plus qu'a attendre que il me désindex. :roll:

Guillaume
 
WRInaute passionné
Je crois que Google a intégré un indice de confiance au classement des pages qu'il indexe. Les 1ers critères mis en place sont des critères basés sur l'ancienneté.

Remarque intéressante facilement vérifiable.

Je confirme également que pour la reqûete qui m'interesse, tout comme Fandecine, les pages qui trônent en tête on déja quelques années derrière elles.
 
WRInaute accro
oli004 a dit:
Je confirme également que pour la reqûete qui m'interesse, tout comme Fandecine, les pages qui trônent en tête on déja quelques années derrière elles.
oui, mais d'un autre côté, un site qui a qq années de bouteille, a eu tout son temps pour nouer des partenariats, s'incrire sur des annuaires voire même être sur GG directory (via DMOZ) ... travailler ses textes de liens ...ses pages sont souvent toutes indéxées ... ça aide un peu ... non ?

avec la limitation de vitesse "sandbox", être bien positionné prend un peu plus de temps ... et finalement c'est peut être parce qu'il est bien classé qu'il a de l'age ... et non l'inverse ... (surtout depuis 2003, date à laquelle les "radars" semblent avoir été installés d'après fandecine) :lol:
 
WRInaute discret
Avec ma très petite expérience, notre site a été sandboxé pendant 45 jours à 2 mois. Je ne suis pas sûr de la raison mais cela a apparut mi-juin (donc après l'effet bourbon de fin mai). C'était peut-être dû à des redirection 302 de spamer ou dû à une période dans laquelle j'ai inscris notre site à plusieurs annuaires en peu de temps (qu'une centaine mais auparavant, il n'y en avait pas). Est ce que c'était réellement un "sandboxage" (je viens d'inventer un nouveau mot) ?

Quoi qu'il en est, on reapparait sur GG mais une semaine avant la réapparition, on était aux même positions que celles d'aujourd'hui sur toutes les requêtes testées avec une seule étoile. Et tout d'un coup, le matin on apparaissait et le soir disparru et cela pendant encore une semaine.

Voilà, je laisse au spécialiste le choix de prendre mon exemple comme critère de réflexion. Je ne sais pas si cela va vous faire avancer mais je vous fait part de l'expérience récente de notre site.

A vous
 
WRInaute passionné
Bonjour, telefitou. Je connais bien ton problème :wink: qui n'a rien à voir avec la sandbox mais plutôt avec un "vol de positionnement" (certain annuaires ont des méthodes assez sauvages!) soupoudré d'un soupson de bourbon. Les symptomes et les remèdes sont différents!
 
WRInaute passionné
Cendrillon a dit:
oli004 a dit:
Je confirme également que pour la reqûete qui m'interesse, tout comme Fandecine, les pages qui trônent en tête on déja quelques années derrière elles.
oui, mais d'un autre côté, un site qui a qq années de bouteille, a eu tout son temps pour nouer des partenariats, s'incrire sur des annuaires voire même être sur GG directory (via DMOZ) ... travailler ses textes de liens ...ses pages sont souvent toutes indéxées ... ça aide un peu ... non ?

Si je te suis bien Cendrillon, tu avances là les principaux termes liés au pagerank . (partenariat, gg directory, DMOZ)

hors, il y a eu suffisament de discussions certes très contestées pour dire que le PR n'influait pas sur le positionnement. Toutefois, tu sembles penser le contraire, et moi aussi d'ailleurs mais en partie.

Petite précision, mon site est également dans dmoz, et le directory GG.
Pour ce qui est des textes travaillés, c'est le cas aussi. Et je dirai que ce qui me différencie des sites qui sont devant moi, se résume en deux critères : leur niveau de PR, et leur ancienneté. Il ne faut peut être pas généraliser mais c'est un fait.

Je fais également une autre remarque qui peut être à étudier :

Dès que je suis sorti du sable sur la requête dont j'étais filtré, en utilisant l'outil de fredax (avec les x*) j'ai constaté que ma sortie de filtre s'est accompagné simultanément par la venue dans le classement d'une deuxième page de mon site en position 1 avec 38*. Je considère qu'il s'agit de la page la plus pertinante de mon site au ragard de la requête consernée.

alors qu'en penser ?
 
WRInaute accro
Que d´idées !! eh bien moi aussi j´ai eu la mienne hier soir...!!

En fait je suis parti du constat que le sandbox semble :

1) se manifester lorsqu´il y a une grande augmentation de BL en un temps réduit

2) ne toucher que certaines expressions qui nous semblent "concurrentielles"

Peutetre que google est capable d´analyser ces critères en même temps :

- Si un site obtient trop de BL d´un seul coup, alors je sandbox les expressions correspondantes aux anchor text de ces nombreux BL

Résultat : comme on essaye d´obtenir un maximum de BL avec les termes visés (qui sont souvent les terme que l on juge porteur pour son site, donc concurrentiel à priori), on essaye d´obtenir des anchor text adaptés.

Trop de BL d un coup : les anchor text utilisés passent dans le "Sandbox" google pour notre site.

Et si en plus vous ajouter la dimension "les BL proviennent tous ou en grande partie d´un meme NDD"...... ou/et sont des BL réciproques entre deux sites......... on s´apercoit qu´il ne serait pas difficile pour google de "freiner" un site qui semble a tout prix et par tous les moyens vouloir placer ses pages sur des requêtes précises en échangeant un maximum de liens comportant ces termes en anchor text (effet google bombing).....

Il faudrait donc voir si une augmentation importante de BL ayant des anchor text différents et provenant de sites différents a pour conséquence :

- pas de sandbox
- sandbox sur tous les termes des anchor text employés

alors ? ;)
 
WRInaute passionné
herveG a dit:
- Si un site obtient trop de BL d´un seul coup, alors je sandbox les expressions correspondantes aux anchor text de ces nombreux BL

Résultat : comme on essaye d´obtenir un maximum de BL avec les termes visés (qui sont souvent les terme que l on juge porteur pour son site, donc concurrentiel à priori), on essaye d´obtenir des anchor text adaptés.

Trop de BL d un coup : les anchor text utilisés passent dans le "Sandbox" google pour notre site.

Cela se confirme en tout cas pour moi.

Il faudrait donc voir si une augmentation importante de BL ayant des anchor text différents et provenant de sites différents a pour conséquence :

- pas de sandbox

pas facile à faire !!!

Si ton site traite des sucettes à l'annis, comment veux-tu avoir des anchor text différents ? :wink:

- sandbox sur tous les termes des anchor text employés

humm, risqué. C'est un coup à t'effrayer de rechercher des liens :wink:
 
WRInaute accro
Et pourtant....mes sites sandboxés l ont été sur des dizaines voire des centaine de termes.

on pourrait tourner la question autrement :

Sur un site sandboxé (toutes les requetes ou presque au dela de la 200eme ou 300eme place), est ce que les quelques requetes "non sandboxées" sont des requetes qui ne sont jamais des anchor text de BL ?
 
WRInaute passionné
Et pourtant....mes sites sandboxés l ont été sur des dizaines voire des centaine de termes.

On pourrait croire qu'à partir d'un certain nombre de requête ayant un lien de pertinance commun et optimisées pour l'ensemble de ses requête se voit sandboxé sur la totalité du site.

Je donne un exemple :

un site qui traite d'imm0bill*er visera peut etre :
- imm0bill*er
- loc@tion m@ison
- loc@tion @ppartem*ent
- vente @ppartem*ent
- vente m@ison
- m@ison paris

Et se vera filtré sur toutes les expressions du site contenant "m@ison" ou "@ppartem*ent" ou "loc@tion" ....

D'ou l'impression d'un sandbox du site via son ndd, alors que ce sont en fait toutes les requêtes qui sont pénalisés et pas le ndd.

Il te suffit d'essayer de te positionner sur un domaine très peu concurentiel, comme la téléphonie, euh ... non, là je déconne :wink: mais sur une expression très peu usitée (exemple "mare à cannard", pour vérifier que ton ndd n'est pas "sandboxé"
 
WRInaute passionné
Le site de mon profil a été sandboxé 6 mois sur toutes les expressions, y compris des trucs hyper particuliers avec 15 mots-clés, pendant 6 mois.
Une exception les derniers mois : la requête avec le nom de l'entreptrise et donc le nom de domaine : net@lys
 
WRInaute impliqué
un critère important :
il ne faut pas voir la sandbox sous l'angle "nouveau site" ou "ancien site", la sandbox s'applique aux NOUVELLES PAGES.
explications : google analyse toutes les nouvelles pages et le filtre sandbox est donc appliqué ou pas selon le cas, c'est pour cela que pour un nouveau site on constate que beaucoup de pages sont sandboxées voir la totalité , et que pour un ancien site une seule nouvelle page est sandboxée.
on peut parler de sandbox sélective et tout le monde peut être touché par celle-ci.

-------------------------------------------------------------------------------

je trouve que la discussion repart dans trop de directions, nous ne faisons que nous répéter sans cesse, nous ne sommes plus constructifs et c'est pour cela que peu de membres participent encore aux discussions sur la sandbox, il faudrait avancer dans nos hypothèses pour les confirmer.
pour cela nous pourrions lancer une série de tests, par exemple :

1) lancer une page sur un terme concurrentiel comme "vetements" sur un vieux site afin de voir si on arrive à éviter une sandbox sur cette page.
cela nous permettrait de voir si on arrive à éviter la sandbox sélective avec un site ancien reconnu par google.

2) essayer de sortir quelqu'un de la sandbox.
pour cela je pense qu'il faut absolument le tirer vers le haut, aucun lien dans les annuaires et beaucoup de liens différents faits par les membres de wri qui participent à ce test.
cela nous permettrait de voir si oui ou non on peut agir sur la durée de la sandbox ou si la période est fixe et définitive.

3) aider un membre à lancer son site.
on appliquerait un certains nombres de règles qu'on connait afin d'éviter la sandbox.
cela permettrait de voir si on peut vraiment éviter la sandbox à un nouveau site.

ceux qui sont partants pour participer à ce test "sandbox" doivent poster un message en marquant pour quel numéro de test ils peuvent apporter leur contribution.
c'est la seule facon d'avancer dans la compréhension de la sandbox.
à vous de jouer :wink:
 
WRInaute accro
Je veux bien m occuper du premier test. je crée une page sur mon site qui a déja plusieurs années d´anciennenté.

Par contre, il faut défnir la facon de réaliser cette page et la facon dont elle va être liée (car on est presque tous d´accord pour dire que ce sont les BL qui semblent "déclencher" un Sandbox......)

Au fait, j ai créer une page il y a quelques jours, indéxée aujourd´hui sur un terme assez concurrentiel (près d´1 millions de réponse) et ´cette page se place d´emblée en 37eme position sur la requete, donc pas de sandbox adns ce cas là. il resterait a faire un max de BL vers elle pour voir si elle "tombe" dans le sandbox....
 
WRInaute impliqué
super hervé, je suis contente que tu participes, je suis sure que ces tests sont les seules choses à faire afin de confirmer nos hypothèses.

je propose que tu fasses cette page, que tu nous donnes l'url afin qu'on puisse donner notre avis mais surtout que tu ne la lie pas pour l'instant, google ne doit pas encore la découvrir.
quand nous serons plus de participants on définira une stratégie pour la création des BL.

on attend beaucoup de participants
merci
 
WRInaute discret
herveG a dit:
Au fait, j ai créer une page il y a quelques jours, indéxée aujourd´hui sur un terme assez concurrentiel (près d´1 millions de réponse) et ´cette page se place d´emblée en 37eme position sur la requete, donc pas de sandbox adns ce cas là. il resterait a faire un max de BL vers elle pour voir si elle "tombe" dans le sandbox....

Bonjour à tous,
Herve G j'ai fais ce test, c'est la sandbox assuré si tu as le même anchor à chaque fois :wink:
Par contre si tu change l'anchor je ne sais pas :?:
 
WRInaute occasionnel
je veux bien participer à ce test. (2 ou 3).
j'ai un site ne contenant qu'une seule page, que je compte développer dans les 3 mois qui suivent. (ce site a été sandboxé pour quelques mois miroir)
et j'ai un site lancé depuis 4 mois. site: 212 ; link: 14 et PR=3.
 
WRInaute passionné
Intéressé par le point n° 3 :
J'ai un site, celui de mon profil, connu dans Google avec deux sous-domaines :
**********
Site connu depuis le mois de mars 2005 par Google.

Le sous domaine : ******** est un blog dotclear que j'ai juste mis en place, pour créer facilement du contenu sans me prendre la tête.
Le but de ce sous-domaine était justement d'anticiper et de tester l'effet SandBox, afin de faire vieillir le site, pendant que je développe le site réel.
Je pense sortir le vrai site d'ici la fin 2005.

Aujourd'hui, après 4 mois, seule les 2 pages d'index sont connus de Google.
***********

Ces deux pages ont été indéxées après la soumission d'un sitemap à Google.
Le sitemap a été soumis à google le 19 juillet 2005.
**********

Pour l'instant seuls quelques liens pointent vers ce site :
- signature dans des forums

Si ce cas d'école vous intéresse pour lancer le site, je suis preneur.

Le lancement du nom de domaine, en l'associant avec un blog, très tôt avant le lancement officiel du site a été fait pour anticiper l'effet SandBox.
Au vu du nombre de pages indexées aujourd'hui dans Google je me dis que j'ai bien fait.
 
WRInaute discret
fandecine a dit:
WebRankInfo a dit:
2- êtes-vous sûrs que cela s'applique pour certains mots-clés seulement et pas pour d'autres ? J'ai en effet l'impression que l'effet est global, mais que la chute de positionnement se voit peut-être davantage sur certaines requêtes concurrentielles
Peut-on réellemnt parler de sandbox lorsque l'on sort dans le top 10 sur une requête qui renvoie 7 ou 800.000 resultats!? La question est là. Et pour répondre, il faut peut-être attendre de sortir de la sandbox pour voir si même dans ce cas il y a amelioration de la position.

+1 avec olivier
Fandecine j'ai un site qui était en sandbox sur la totalité des requettes.
Malgrés ca et après acharnement sur les anchors, le site c'est positionné en 7ème position sur une requette 1 000 000 .
Puis un jour le site est entierement et brusquement sortie de la sandbox sur toutes les requettes.
La requette ou le site etait 7 ème est en m^me temp passé 1er.
 
WRInaute occasionnel
caro a dit:
un critère important :
il ne faut pas voir la sandbox sous l'angle "nouveau site" ou "ancien site", la sandbox s'applique aux NOUVELLES PAGES.

Je ne crois vraiment pas que ce filtre s'applique aux nouvelles pages des anciens sites : je crée régulièrement de nouvelles pages sur un ancien site pour parler des nouveaux sites qui sont créer : elles sont indexées et bien positionnées, alors que les pages des nouveaux sites ne sont pas du tout positionnées, même avec un fort PR et une excellente optimisation.
 
WRInaute accro
Oui, mais tu n´obtiens pas "nombreux BL" en un temps réduits et qui plus est contenant le meme anchor text......! ca va être l´objet du test et de la page que je vais construire a cet effet.... j espere juste que ce n est pas la totatlité du site qui va etre sandboxée suite a ce test....!! :(
 
WRInaute passionné
Pour le test n°2, j'en ai déjà fait un :

J'avaus 2 sites pénalisés sur une suite de mots-clés depuis fin-janvier, après avoir utilisé un système de soumission massive. Les 2 sites ont été sandboxés à la même date... ils sont également sortis de la sandbox à la même date.

J'avais testé de solutions pour sortir du piège :
-site 1 - test de sortie "par le haut" : J'ai essayé de diluer ces mauvais backlinks dans une campagne de recherche de backlinks plus diversifiés et de bonne qualité =>sans effet.
-site 2 - test de sortie "par le bas" : J'ai essayé de supprimer les mauvais backlinks en me désinscrivant de quelques annuaires... Le site est réapparu en 3eme page seulement sur une requête peu concurrentielle.

Ces évenements sont passés, j'en ai aucune preuve pour le test. Mais ça peut donner lieu a vérification.
 
WRInaute accro
Tu dis qu ils sont sortis de la sandbox en meme temps. On en déduit donc que tes deux mesures ont eu le meme effet.... c est a dire "pas d´effet"...!! ;)
 
WRInaute impliqué
leffroyable a dit:
caro a dit:
un critère important :
il ne faut pas voir la sandbox sous l'angle "nouveau site" ou "ancien site", la sandbox s'applique aux NOUVELLES PAGES.

Je ne crois vraiment pas que ce filtre s'applique aux nouvelles pages des anciens sites : je crée régulièrement de nouvelles pages sur un ancien site pour parler des nouveaux sites qui sont créer : elles sont indexées et bien positionnées, alors que les pages des nouveaux sites ne sont pas du tout positionnées, même avec un fort PR et une excellente optimisation.

je suis sure à 95% de ce que j'annonce, et ceci après pas mal de tests.
je te propose de faire une page concurrentielle sur ton site sur par exemple la requete "tee shirt", tu vas faire une page optimisée, tu vas faire des BL avec liens différents, enfin tu vas essayer de la placer au mieux en essayant d'éviter la sandbox.
ce serait très intéressant de voir comment va se placer ta page, si tu veux vraiment mettre le paquet pour rentrer assez haut dans les résultats tu ne pourras pas éviter la sandbox.

fonctionnement de la sandbox :
à ce jour google essaie de frainer les spammers qui faisaient monter des sites très hauts dans les résultats de manière non naturelle.
donc google doit analyser pour cela toutes les nouvelles pages, imagine je suis un spammeur, j'ai qu'à racheter un ancien site à quelqu'un pas cher et hop je place plein de pages sat dans les résultats, trop facile ! google n'analyse pas le site mais les pages !
 
WRInaute impliqué
concernant le test de magig yoyo il faut analyser dans quelles conditions il a fait les liens.
quand je parle de sortir par le haut, il faut vraiment mettre le paquet, donc on ne peut pas tirer de conclusion grace à magic yoyo.
Combien de liens ont été faits ? quels PR ? sur combien de sites ? ...

nous devons faire ce test quoiqu'il en soit de manière très rigoureuse, pour sortir un site de la sandbox par le haut il faut vraiment choper beaucoup de BONS liens de facon à prouver à google que la popularité de la page est naturelle et pas du spam.


il faut encore attendre plus de participants car il faudra beaucoup de sites pour faire des liens sur les pages tests.
quand on sera assez nombreux, on organisera soigneusement les tests.
 
WRInaute passionné
Je peux t'en pondre une dizaine de liens si tu veux !?? (PR 3-4)
Je crois pas que l'obtention de liens sera un problème.
 
WRInaute discret
Slt,

moi je veux bien participer à toute sorte d'analyse si vous voulez.
Je suis prêt à tout essayer maintenant :(.

Petit résumé perso sur le NDD de mon profil:
-Créé en 2002 (comme quoi la sandbox ne se limite pas au site d'après 2003)
-Première disparition constatée sur des requêtes importantes en juin 2004
-Perte du PageRank de 6 à 0
-Disparition complète sur ma requête la plus importante visée "fond ecran" (je vais quand même pas viser "choucroute garnie" pour faire plaisir à GG ???)
-Yoyo constant sur des requêtes de 3 mots (apparaît, apparaît pas) mais ce qui est constant c'est que seule la page d'accueil sort de temps en temps en réponse comme si les autres pages étaient indexées mais filtrées pour ne jamais apparaître en résultat d'un requête.
-Présent dans DMOZ mais déclassé en bas de page pour GGDirectory car sans PR.
...

Pourtant le site ne me parait pas blacklisté:
Plus de 10.000 pages retournées avec la commande site: (la moitié cependant sans titre ni description)
Plus de 7.000 links avec link: (provenant toutefois pas de 7.000 sites différents)

Tenté (sans résultat):
-'Désuroptimiser',
-Rajouter des anchors différents sur différents annuaires,
-Mailer GooGle (sans réponse)
-Supprimer les erreurs 404 et suppression de redirection automatique vers l'accueil,
-Supprimer les annuaires avec redirection 302...
mais rien n'y fait. Il me semble pourtant que j'ai du contenu réel et inédit (mes pages ne sont pas du spam) qui pourrait intéresser beaucoup de monde du moins qui justifierait d'apparaître dans les premières pages.

Voila. Je pense pas que ça fera avancer le smilblick mais ça permet juste de vous soumettre un nouvel exemple de site frappé en plein face par ce phénomène étrange appelé "sandbox". Si je peux apporter ma modeste contribution à un quelconque test, ça sera avec avec grand plaisir (MP ou pas).
 
WRInaute impliqué
ActuCritique, ton cas est compliqué, je ne pense pas que ton site soit une bonne base de test car tes liens se comptent par milliers mais sont regroupés sur seulement quelques sites, et pour le reste trop d'annuaires.

que fait un spammeur pour obtenir des liens par milliers, il s'inscrit sur des milliers d'annuaires très facilement, google ne se laissera plus avoir.
attention ActuCritique je n'ai jamais dit que tu étais un spammeur, juste qu'à l'époque on ne s'attendrait pas à ce que google juge de cette manière les annuaires.

la qualité des liens est aussi primordiale que la quantité.
1000 liens sur 1 site < 1 lien sur 5 sites différents
 
WRInaute impliqué
magicien, pour les tests 2 et 3 ce serait intéressant,
parle nous plus de :

test 2 : ton site qui est sandboxé
url :
date d'indexation par google :
date de sandbox :
requete principale visée :
PR :
anchor dans les liens :
nb de liens autres que annuaires :
nb de liens provenant d'annuaires :
nb de liens "site" : combien de sites hors annuaires ont fait un lien (si tu as 1 site qui fait 300 liens ca fait qu'1 "lien site")
tes idées sur les raisons probables de sandbox :
(augmentation brusque liens, liens avec memes anchor, changement global contenu site, brusque augmentation pages, trop d'annuaires liens, ...)
qu'as tu essayé pour t'en sortir :
attention ne regarde pas que tes liens par la commande link, sers toi de msn, yahoo, commande "monsite.com" ...

test 3 : ton site nouveau tout neuf
url :
date d'indexation :
a t'il des liens :
comment google l'a connu :



après analyse on verra si on peut se servir d'un de tes sites
il est vrai qu'il vaut mieux partir sur de bonnes bases pour faire ce genre de tests, un historique trop compliqué du site ne ferait que foutre la pagaille.
merci
 
WRInaute discret
caro a dit:
tes liens se comptent par milliers mais sont regroupés sur seulement quelques sites...
??? :roll:

Caro, il me semble que tu te bases sur les resultats de la commande link de GG pour dire ça.
Celle de Yahoo (réconnue comme étant plus perspicace) renvoie bien plusieurs sites de qualité ainsi que des tas d'annuaires comme tous les sites Internet connus.

Les annuaires sont justement la base pour se faire des liens de qualité.
Car seul un site de qualité avec du contenu sera accepté par des tas d'annuaires! Un site de spammeur ne sera jamais accepté sur autant d'annuaire.

Maintenant, ravi d'apprendre cette nouvelle théorie que les annuaires sont mal vus par GG?!? Ceux qui font des redirections avec des 302 je peux comprendre, ceux avec lien dur, je reste sceptique.
 
WRInaute impliqué
sincèrement je ne pense pas que les liens annuaires soient considérés par google comme des liens de qualité, s'inscrire dans des tas d'annuaires est la portée de tous, avoir 50 sites qui font 1 seul lien de qualité dans le meme thème est hautement plus complexe et qualitatif.
je dirais meme un parcours du combattant.

mais ce ne sont que des suppositions faites au fil du temps en analysant mes sites et ceux de quelques membres wri. tout le monde peut se tromper mais dans la plupart des forums anglophones les membres pensent aussi que les liens annuaires n'ont que très peu de valeur, ou le fait d'avoir 1000 liens sur 1 seul site est loin d'avoir la valeur de 1000 BL.

ps : je ne fais aucune critique en faisant cette remarque, je ne te considère en aucun cas comme spammeur ou autre, c'est juste que je pense que ces liens ne sont pas bons et que ce sera plus compliqué à analyser à cause du nb.
 
WRInaute discret
caro a dit:
le fait d'avoir 1000 liens sur 1 seul site est loin d'avoir la valeur de 1000 BL.
:lol: Tu laisses encore sous-entendre que mon site n'a que peu de BL hors annuaire. Rien que dans ma rubrique partenaire, y'en a déjà au moins une vingtaine.

Il me semblait que l'exemple serait plus parlant sur un vieux site que sur un jeune site de 6 mois dont on sait pas encore forcement si il s'agit de sanction sandBox ou de délai d'indexation plus long que par le passé.

Enfin bon, dommage de se plaindre du manque de participants et d'en exclure un la même page.

Bonne continuation à cette étude!
 
WRInaute discret
moi je suis partant pour les 3 etapes, et je lance justement quelques nouveaux site dans des domaines concurentiels
(poker et voyage) ;)
 
WRInaute accro
oli004 a dit:
Si je te suis bien Cendrillon, tu avances là les principaux termes liés au pagerank . (partenariat, gg directory, DMOZ)

hors, il y a eu suffisament de discussions certes très contestées pour dire que le PR n'influait pas sur le positionnement. Toutefois, tu sembles penser le contraire, et moi aussi d'ailleurs mais en partie.
non, je ne pense pas au PR mais au fait que le positionnement d'une page est fortement conditionné aux BL qui pointent vers elle et plus particulièrement aux "texts anchor" de ces liens ... et avec la limitation de vitesse "effet sandbox" ... il faut un peu de temps pour les mettre en place ... :wink:

herveG a dit:
Sur un site sandboxé (toutes les requetes ou presque au dela de la 200eme ou 300eme place), est ce que les quelques requetes "non sandboxées" sont des requetes qui ne sont jamais des anchor text de BL ?
je pense que tu es sur une bonne piste ... ceux qui constatent des sandbox sélectives sur des mots clés en particulier devraient peut être les rapprocher des "text anchor" revenant le plus souvent dans leurs liens ... :wink:

caro > excellente initiative ... bonne chance pour tes tests ...
 
WRInaute discret
Salut,

En fait, pour le point 2, je n'ai pas de site sandboxé, mais je suis d'accord pour essayer de sortir quelqu'un de la sandbox à l'aide du site de mon profil. J'en ai un autre PR5 également.

Pour le point 3, j'ai créé un site suivant :
url : w*w.informatique-pour-tous.com
Date d'indexation : 27 juillet 2005
Date d'indexation des autres pages : 4 aout 2005, suite à ajout sitemap.
A t-il des liens : oui, car inscription à de nombreux annuaires (à partir du 7 aout), sachant que je risque la sandbox vu le nombre (c'est même certain).
Google l'a connu depuis un lien depuis le site de mon profil.

Le site ne correspond peut être pas aux critères... a voir.
 
WRInaute passionné
parallèlement, je suis en train de faire le test suivant :

J'ai un NDD quia un an . En index, je n'ai qu'une page d'accueil invitant d'aller sur un autre site (celui de mon profil), puis deux liens vers deux repertoires contenant deux sites totalement différents et traitant de sujet n'ayant aucun point commun. La structure est donc celle-ci :

-www.lesite.com/
-www.lesite.com/site1/
-www.lesite.com/site2/

L'accueil vise une requête composée de deux mots et je suis assez bien positionné dessus puisque j'utilise un terme très utilisé "infographie" et l'autre étant un terme de géolocalisation donc ça limite les réponses renvoyées par gg et ne comporte pas les "mot1" et "mot2".

sur les deux site 1 et 2 , je ne fais aucune campagne massive de reherche de BL et ils comportent un nombre très faible de pages (disons une dizaine pour l'un et une trentaine pour l'autre)


site1 s'interesse à une requête "mot1" renvoyant 1 600 000 réponses et aucun adwords.
site2 s'interesse à une requête "mot2" renvoyant 775 000 réponse et quelques adwords.

Constataion après quelques mois :


"infographie" + "des noms de ville" sur NDD ne sont pas filtrés

"mot1" sur site 1 est filtré :
position > 100 sans artifice
position : dans les 2 premieres pages
- avec /*** 38 *
- avec des accents dans la requête

MSN : 1er et 2eme position sur 880 000 réponses et quelques sites sponsorisés.
YAHOO : pages non encore indexées (2 660 000 réponses retournées)

***

"mot2" sur site 2 est filtré aussi :
position sans artifice > invisible sur recherche en recherche web
position sans artifice > 80 ème sur 22 000 réponses en recherche france
position : 4 ème avec un accent

MSN : 2ème et 3ème positions sur 962 000 réponses et quelques sites sponsorisés.
YAHOO : pages non encore indexées (4 050 000 réponses retournées)

Dans le première cas, comme dans le deuxième, je n'ai pratiquement aucun BL externe ou très peu !

-www.lesite.com/ est PR3
-www.lesite.com/site1/ est PR3
-www.lesite.com/site2/ est PR2
Un lien dans les footers des sites 1 et 2 renvoit vers la home
 
WRInaute impliqué
ActuCritique, je ne suis en aucun chef de ces tests et je ne t'ai jamais exclu. je veux juste te dire que ton site est plus difficile à analyser peut etre qu'un autre site et surtout que la structure de tes liens vont à l'encontre de ce que l'on pense (rapport BL annuaire/BL références en défaveur, rapport nb BL/ nb sites aussi déséquilibré ..)
quoiqu'il en soit ce n'est pas à moi de décider, les participants s'inscrivent et après on verra
en tout cas je te souhaite de vite sortir de la sandbox car je connais ca et c'est vraiment déprimant
 
Nouveau WRInaute
J'ai une autre suggestion conçernant cette fameuse SandBox :

- Pour ma part j'ai remarqué que, si je fais un ou plusieurs liens vers un nouveau site, et que je passe sur GooGle deux ou trois jours après pour voir si le nouveau site linké est bien pris en compte, (par la commande www.lenouveaunomdedomaine.tld dans la boite de recherche GooGle), très étonnament celui-ci se retrouve dans le bac a sable (fin et chaud, mais tout de meme tres désagréable dans les chaussure et le maillot de bain :(

Ca m'est arrivé a plusieurs reprises .., suis-je le seul ?

GooGle ne pourrait-il pas repèrer quand un site récent est trop recherché par "www.leditsite.com", alors que personne a part le webmaster ne peut le connaitre, puisqu'il n'est pas encore référencé ??

THAT is THE QUESTION !?
 
WRInaute impliqué
magicien, ton site informatique-pour-tous.c0m aurait pu être intéressant à analyser et à sortir de la sandbox, cependant il va à l'encontre meme de nos idées.
il est bel et bien sandboxé (voir nom de domaine), mais tu as fait des tas de liens sur des annuaires et ceci est un critère que l'on pense décisif et pénalisant, trop d'annuaires et trop de liens d'un coup.
il serait bien trop dur à sortir de la sandbox de ce fait.

pour le test 3, il faudrait qu'on aide un site qui ouvre mais qui n'a pas déjà fait les erreurs pénalisantes (trop de BL, trop d'annuaires, ...).
sinon ca revient à faire le test2 (sortir quelqu'un de la sandbox), le but du test2 est d'aider un site nouveau à pas tomber dans la sandbox.
 
WRInaute impliqué
skillfull a dit:
moi je suis partant pour les 3 etapes, et je lance justement quelques nouveaux site dans des domaines concurentiels
(poker et voyage) ;)

skillfull, ce serait bien que tu participes au test3, c'est à dire qu'on t'aide à lancer un nouveau site, attention site vierge, aucun lien annuaire ou autre doit avoir été fait.
dis nous quel serait ce site :
date ouverture :
est il indexé :
requete visé :
liens faits :




en parallèle j'ai lancé un test afin de voir si avec aucune clé dans l'anchor on peut éviter ou pas la sandbox, je vous tiens au courant d'ici la semaine prochaine.
 
WRInaute impliqué
url : -www.euro-argentine.com
date d'indexation par google : 5 avril 2005
date de sandbox : fin avril 2005
requete principale visée : argentine voyage
PR : 3
nb de liens autres que annuaires : 86
nb de liens provenant d'annuaires : 130
nb de liens "site" : 6
raisons probables de sandbox : annuaires
Rien tenté pour en sortir à part attendre...
 
WRInaute passionné
Je suis étonné que personne n'est encore réagit suite à la description du test que j'ai indiqué il y a quelques heures informant que deux requêtes totalement différentes d'un même site etaient filtrées sans même que le site consernée n'est subbit de croissance du nombre de BL. :roll:
 
WRInaute accro
je réagi : j'ai connu exactement le même phénomène qui serait donc un sandbowage sans relation avec les BL...... c est fort ca....! reste plus que l'age du site..... ou d'autres trucs.....!! ;)
 
WRInaute passionné
Houlal! je m'absente 24 heures et paf! Tout plein de nouveaux post.
J'ai pas analyé tout ce que vous avez écrit (il se fait tard) mais je releve deux choses:



caro a dit:
la qualité des liens est aussi primordiale que la quantité.
1000 liens sur 1 site < 1 lien sur 5 sites différents

Pas tout a fait d'accord. GGguy insiste fortement sur les liens croisés et trés contextuels.

Exemple:

Le site A est une base de données de bandes originales de films
le site B est une base de données de film
le site c vends des dvd

Chaque site contient plusieurs milliers de références. Et bien, le meilleur échange de lien est pour A de faire correspondre la BO avec la fiche du film de B et le DVD de C. Pour B de faire pointer un lien depuis une fiche de film vers la BO correspondante de A et le DVD de C et etc...

L'exemple est simple avec 3 sites, mais on peut l'imaginer avec bien plus. Resultat des BL a profusion, trés contextuels qui plus est, de plus, en profondeur dans les pages du site et enfin des liens sortants (j'insite sur les liens sortant!) Cela fournis un plus réel pour l'internaute en implémentant une navigation naturelle qui plait desormais à GG. J'ai rien inventé, les gros sites font déjà comme ça.

Je suis donc pas tout afait d'accord avec caro et pense que les centaine voir milliers de liens de cette sorte sont excellent pour le référencement (et les referers aussi! :D )

Cendrillon a dit:
herveG a dit:
Sur un site sandboxé (toutes les requetes ou presque au dela de la 200eme ou 300eme place), est ce que les quelques requetes "non sandboxées" sont des requetes qui ne sont jamais des anchor text de BL ?
je pense que tu es sur une bonne piste ... ceux qui constatent des sandbox sélectives sur des mots clés en particulier devraient peut être les rapprocher des "text anchor" revenant le plus souvent dans leurs liens ... :wink:
...

Faut y réflechir! Quand tu fait un millier de liens par exemple c'est difficile de varier les encres (pour ma part je prends un mot clé + le titre du film en clair). Maintenant cela voudrait-il dire que pour éviter le bac à sable il ne faut plus mettre ses mots clés dans les encres et en revenir au bon vieux "cliquez ici" 8O !

Enfin, pour ce qui est des idées de test, je teste en ce moment l'importance des liens sortants:

2 pages avec même thématique, même occurence de mots clés (certain ce recoupent) et même "concurentialité" de mot clés, même nombre de BL, provenant du même nombre de site. Enfin toyt pareil sauf le contenu et que l'une n'a aucun liens sortant et l'autre en a. On verra bien!
 
WRInaute accro
fandecine a dit:
Cendrillon a dit:
herveG a dit:
Sur un site sandboxé (toutes les requetes ou presque au dela de la 200eme ou 300eme place), est ce que les quelques requetes "non sandboxées" sont des requetes qui ne sont jamais des anchor text de BL ?
je pense que tu es sur une bonne piste ... ceux qui constatent des sandbox sélectives sur des mots clés en particulier devraient peut être les rapprocher des "text anchor" revenant le plus souvent dans leurs liens ... :wink:
...

Faut y réflechir! Quand tu fait un millier de liens par exemple c'est difficile de varier les encres (pour ma part je prends un mot clé + le titre du film en clair). Maintenant cela voudrait-il dire que pour éviter le bac à sable il ne faut plus mettre ses mots clés dans les encres et en revenir au bon vieux "cliquez ici" 8O !
ce n'est pas tout à fait ce que je voulais dire (et je ne pense que le soit non plus le cas pour HerveG) ... certains ont dit qu'il pouvait y avoir des sandbox sélectives ... alors imagine que tu ais un accroissement soudain de backlink, avec pour ces BL un "text anchor" qui reviendrait très souvent (genre une campagne d'inscription massive et automatique dans les annuaires) ... alors il est possible d'avoir une sandbox sélective sur ce "text anchor" ... vois tu ce que je veux dire ? :lol:
 
Discussions similaires
Haut