Google : tri par date

WRInaute passionné
Salut à tous,

Il y a quand même un truc qui me laisse sceptique chez Google.
Si vous allez sur le labs : http://labs.google.com/
vous avez une liste de fonctionalités de recherches plus ou moins puissante qui font parler de Google chaque fois qu'un nouveau projet est lancé.

Par contre, Google, le moteur, est incapable de proposer un classement des résultats par date. Si elle existe je ne l'ai pas trouvée.
Cette fonction existe sur Google Groups, Google Actualité, sur Exalead.

Je recherche "taille de l index google" sur le module de recherche WRI.
Le premier résultat date de : 10 novembre 2004

il faut aller en 2° page pour trouver un post qui date du 27 septembre 2005.

Avec Google il est possible de trouver, en temps réel, une limousine à Cleveland, mais il n'est pas possible de faire un tri par date :?
http://labs.google.com/ridefinder
 
WRInaute passionné
sgaze a dit:
Un tri par quoi ? Par date de mise en cache ?

par date de première apparition de la page dans l'index de Google par exemple.
Par date de mise en cache ou par date d'indexation, ça ne sert à rien.
C'est faisable sur Google actualités, sur Exalead, sur n'importe quel crawler Open Source, mais pas sur Google, moteur !
 
WRInaute passionné
Peut etre que Google n'a pas forcément "envie", car ça nous permettrais de décortiquer encore plus l'algo...
 
WRInaute passionné
rottman a dit:
Peut etre que Google n'a pas forcément "envie", car ça nous permettrais de décortiquer encore plus l'algo...

ce serait dommage, c'est une option relativement simple à mettre en oeuvre, et en plus Google sait faire.
Je ne pense pas qu'une telle info puisse révéler quoi que ce soit sur l'algo de Google.
De temps en temps, je ne recherche pas l'info la plus pertinente, au sens Google du terme, mais l'info la plus récente. ( ce que je fait systématique sur Google News ).
 
WRInaute discret
amha c'est justement pour marquer la distinction entre google news et google moteur

google news donne l'info la plus récente
google moteur donne l'info la plus pertinente

ajouter cette fonctionnalité dans google moteur pourrait affaiblir le positionnement de chacun
 
WRInaute accro
Exact :wink: surtout que les pages sont souvent modifiées... la date de première apparition n'a donc pas d'intéret et c'est pas parcequ'elle a été modifiée récement qu'elle est pertinente (si la page affiche la date elle est modifiée tous les jours par exemple).

C'est très différent pour l'actu...
 
WRInaute passionné
squawk a dit:
Exact :wink: surtout que les pages sont souvent modifiées... la date de première apparition n'a donc pas d'intéret

... pour toi

je ne parle pas de modifier le classement par défaut du moteur Google.
mais de rajouter une option dans le formulaire de recherche avancée.

Détecter de nouvelles pages, dans un ou plusieurs secteurs, est une information que je trouve intéressante.

A une époque j'avais un crawler qui faisait une recherche avancée sur Google en limitant l'intervalle de date à un jour ( option daterange: exprimé en jour julien ).

Exemple de requêtes avec daterange
chirac daterange:2453668-2453669

cette requête retourne plus de 6 millions de résultats. Donc pour moi ce n'est pas de l'info c'est du bruit.

Quand les crawlers de Google étaient moins performant cette information étaient intéressante, car une telle requête retournait uniquement quelques centaines de pages.
J'utilisait cette technique pour détecter trés tôt de nouveaux noms de domaine qui démarraient leur activité.

Google veut percer sur le marché du B2B ( voir communiqué de presse récent de la société ), il a intérêt de proposer des options de recherches un peu plus poussé que sa page de recherche avancée actuelle.
 
WRInaute passionné
ct possible a un moment avec des recherches de ce type
site:webrankinfo.com daterange:2453668-2453669

mais apparement ca marche plus, faut croire qu'ils ont désactivé l'option
 
WRInaute passionné
tout a l'heure j'avais un écart de 2 milions de page entre :
chirac daterange:2453668-2453669
et
chirac
l'écart vient de disparaître.

je ne sais pas si l'option a été désactivée, elle est encore dans la page de recherche avancée.
AMHA c'est plus lié à l'augmentation de la capacité de crawl de Google qui rend l'option moins pertinente.
 
Nouveau WRInaute
Bonjour,

J'ai mis en place cette fonctionnalité sur dir.com la semaine dernière.
exemple "wilma jj<5"
avec jj pour jour, hh pour heure, et mm pour mois.

Philippe.
 
WRInaute passionné
pompos a dit:
Bonjour,

J'ai mis en place cette fonctionnalité sur dir.com la semaine dernière.
exemple "wilma jj<5"
avec jj pour jour, hh pour heure, et mm pour mois.

Philippe.

Salut,
Tu te base sur quelle date : la date du dernier crawl ?
Vous gardez en mémoire la date de première indexation d'une url ?
Tu peux rajouter une option de tri par date croissant ou décroissant ?
Taille de l'index ?

Question subsidiaire : tu peux me filer le code source de pompos :D :D

Même si dir.com est loin de la popularité de Google :wink:, c'est sympa d'avoir un développeur de moteur de recherche sur le forum.
 
Nouveau WRInaute
spidetra a dit:
Salut,
Tu te base sur quelle date : la date du dernier crawl ?
Vous gardez en mémoire la date de première indexation d'une url ?
Tu peux rajouter une option de tri par date croissant ou décroissant ?
Taille de l'index ?

Question subsidiaire : tu peux me filer le code source de pompos :D :D

Même si dir.com est loin de la popularité de Google :wink:, c'est sympa d'avoir un développeur de moteur de recherche sur le forum.

La date de dernière modification renvoyée par le serveur, et à defaut la date du dernier crawl si la page a changée de façon "significative".
Je garde en mémoire la date du dernier crawl uniquement.
En ce qui concerne le tri par date, je l'ai envisagé mais j'ai d'autres choses plus urgentes pour le moment.
La taille de l'index varie tout le temps.
 
Discussions similaires
Haut