date de modif des pages est-elle si importante ?

  • Auteur de la discussion Auteur de la discussion cohen
  • Date de début Date de début
Nouveau WRInaute
bonjour
tout est dans la question (un peu naive ) mais certaines fois il vaut mieux rabacher comme disait mon vieux prof et d'autre part mon soft insere ce tag ($SITEUPDATED(0)) , est-il valable ? :?:
merci d'avance pour vos conseils
 
WRInaute discret
J'en profite pour poser une question dans le même style : est-ce que Google se préoccupe des TAGs :
- Expires
- Last-Modified
pour mettre à jour son index ? Ou regarde-t-il seulement la modification réelle du contenu du fichier par rapport à son cache ?

Tout ça pour savoir si dans une page dynamique il est utile de mettre un
Code:
header("Last-Modified: ".gmdate("D, d M Y H:i:s")." GMT");
par exemple.

Yvan.
 
WRInaute impliqué
perso je crois qu'il suffit simplement de rebalancer tous les jours la page d'accueil sur le serveur et google l'indexera tous les jours dès qu'il sera habitué à trouver à chaque fois une nouvelle date (de chargement de page sur le serveur) et suivra même tous les liens de cette page et uniquement de cette page
je peux me tromper ou y a t-il d'autres moyens, en tous les cas çà marche comme çà chez moi
 
WRInaute occasionnel
crindor> Je ne suis pas d'accord.
Déjà comment google fait pour récupérer la date de mise en ligne de la page d'accueil ??

Ensuite comment font ceux qui ont des pages générés automatiquement ?
 
WRInaute impliqué
il ne recupere pas de date de mise en ligne, il prend la date a l'horloge parlante au moment de sa visite :)
a aucun moment je ne mets une date sur mes pages et pourtant google en met une, alors ?
 
WRInaute discret
Je suis d'accord avec Deblok. Par contre Google ne récupère pas la date du fichier, enfin je ne pense pas. Ca ne lui servirait à rien, vu que n'importe qui peut mettre sa page à jour tous les jours, alors qu'elle est toujours identique... Et pour le coup de la date interne (header...) je ne trouve pas que ce soit fiable non plus... Alors comment ils font chez Google pour déterminer qu'elle est mise à jour ?

Yvan.
 
Olivier Duffez (admin)
Membre du personnel
et si ils avaient une fonction de comparaison du contenu de 2 pages ? en fonction du résultat, ils savent si la page a été modifiée, un peu, beaucoup, passionnément...
cette fonction peut leur servir aussi pour détecter 2 sites au contenu identique...
 
WRInaute impliqué
La date c la dernière fois qu'il est passé ... pas la dernière fois que la page a été modifié.

bah oui je suis d'accord, mais pour moi cela ne fait pas de difference
ce que je vois est que le spider passe tous les jours et il doit bien y avoir une raison
et cette raison, c'est depuis que je fais ce que je dis, je n'en vois pas d'autre, avant il ne passait que 2 fois par mois

maintenant, est ce que le bidule a repéré le mot "actualité" et un pr supérieur à 4 ?
bonne question
 
WRInaute impliqué
et si ils avaient une fonction de comparaison du contenu de 2 pages ?

c'est possible !
mais bonjour la moulinette pour comparer des milliers de pages d'un site
voir de plusieurs sites pour trouver ce que tu dis
déjà qu'ils doivent ramer pour indexer des milliards de pages, j'ai du mal à imaginer l'usine à gaz
 
Olivier Duffez (admin)
Membre du personnel
ils ont en permanence la dernière version en cache, donc quand Googlebot vient indexer une page, il peut en même temps calculer un taux de modification et le stocker en information relative à l'URL de la page. ça lui permet de se rendre compte si cette page est souvent modifiée.
bien sûr tout cela n'est qu'une grosse hypothèse !
 
WRInaute occasionnel
crindor> il passe tous les jours sur ton site car tu as un pr de 6 ... et qu'avant tu devé avoir un faible PR !!!
 
WRInaute impliqué
il passait deja avant le pr 6
je fais çà depuis septembre alors que le pr était à 5
j'ai eu le pr 6 en novembre avant de le perdre au bout d'un mois , un peu comme beaucoup de sites d'ailleurs
je viens seulement de le recuperer a la derniere google dance

objectif pr 7: mazette y a du boulot
on devrait se cotiser pour acheter une calculette scientifique à monsieur Google, çà serait bien si on pouvait avoir les décimales :)
 
WRInaute passionné
Bonjour,

Je suis persuadé que l'hypothèse de Webrankinfo est la bonne... s'il y a bien une chose moins compliquée à faire par Google que les autres choses dont il est capable, c'est bien une comparaison entre la dernière page en cache et la page scannée par le robot...

Et à ma connaissance, il n'y a aucun moyen fiable pour connaître la date de mise à jour d'une page... vous pensez bien que s'il suffisait d'une ligne de php pour tromper Google, ce ne serait pas le moteur n°1. Google se fait lui-même son opinion pour savoir quand il doit repasser sur vos pages... il ne va pas vous demander à vous de lui indiquer si ça vaut la peine de revenir tous les jours ou pas.

aK.
 
WRInaute impliqué
oui mais alors, comment considere t-il que cela en vaut la peine
si je parlais du mot" actualité " tout a l'heure c'est parce que a une epoque (je ne sais plus maintenant), ce mot avait une importance considerable pour que le robot de voila repasse plus regulierement
c'etait un des criteres qu'il utilisait pour reperer des sites qui sont susceptibles de bouger
est ce que google n'utiliserait pas un systeme similaire en plus du critere 'fort pr"
 
WRInaute discret
Je suis sûr que google calcule le taux de renouvellement d'une page par rapport à celle qu'il a en cache. C'est pour cela que je modifie nettement ma page d'accueil au moins toutes les semaines. Je préfère mettre un texte ancien qui sera considéré comme "nouveau" que de laisser une page inchangée pendant longtemps. Comme ce ne sont pas des news ce n'est pas grave :-)

Ce n'est que pour optimiser le référencement, c'est tout :-)

Quelle proportion de la page faut-il changer, aucune idée, mais une assez grande partie je pense. Je change environ 60% du texte de la page et je suis sûr (enfin...) que c'est un élément important.

amicalement
jmm
 
WRInaute discret
À mon avis, il y a un peu des deux :wink:

Il est bien possible que le robot utilise plusieurs méthodes successivement. Peut être qu'il "se pose" plusieurs questions à la suite :

la date que me renvoie le serveur a-t-elle changé ?
-- la taille du fichier a-t-elle changé ?
----y-a-t-il de nouveaux mots-clés ?
------y-a-t-il de nouveaux liens ?
etc, etc. :)

S'il répond non à l'une des questions, peut-être qu'il s'arrête et va voir ailleurs, s'il répond oui, peut-être réindexe-t-il plus ou moins profondément ?

Cela dit, à moins de chercher à bénéficier de l'effet "fresh", je ne vois pas bien l'intérêt de se poser cette question : quel est donc l'intérêt pour le visiteur d'être trompé sur la réelle nouveauté d'une page ?
S'il y a vraiment du contenu nouveau et qu'on veut le lui faire savoir, on le met sur la page d'accueil. Si google fait bien son travail, il donne de l'importance à ces changements.

Il y a un moment où il faut arrêter d'optimiser le confort de(s) moteur(s), puisqu'on ne contrôle pas leur méthode, et où il faut commencer à optimiser le confort des visiteurs (les vrais, pas les robots - ceux-là, ils n'achètent pas de logos gratuit et de sonnerie gratuites, hein :P ).

Après tout, on le paye, ce Google, pour qu'il donne de bons résultats à nos visiteurs (par la pub, indirectement).
Vous ne trouvez pas un peu bizarre de passer en plus des heures à ramper devant son algo ? 8O
Le résultat, c'est peut-être qu'on paye un peu trop pour que google puisse courir devant ceux qui cherchent à le tromper et pas assez pour qu'il améliore ses résultats. Ya comme un cercle vicieux, là :?
 
WRInaute occasionnel
Bonjour,

Aucunes réponses sûres à donner, mais je vous livre mon expérience :

J'ai constaté la prise en compte de la "nouveauté" d'une page même pour une petite modif du genre "le 01/12/2002 ajout du Renault Scenic"

A+
 
Nouveau WRInaute
muratet a dit:
Je préfère mettre un texte ancien qui sera considéré comme "nouveau" que de laisser une page inchangée pendant longtemps. Comme ce ne sont pas des news ce n'est pas grave :-)

Ne penses-tu pas que tes visiteurs (les vrais, par les robots) ne s'en apercevront pas tôt ou tard?

Quand un commerçant veux me faire croire que ses produits sont nouveaux, alors que ce n'est pas vrai, en général, je le quitte pour publicité mensongère!

Les internautes ne seront pas très longtemps les blaireaux de vos farces!
 
WRInaute discret
spygirl a dit:
Ne penses-tu pas que tes visiteurs (les vrais, par les robots) ne s'en apercevront pas tôt ou tard?

Je ne veux pas du tout tromper les visiteurs, puisque je mets au début de mon texte la date à laquelle il a été écrit.

Ma page est renouvellée chaque semaine, sauf pendant les vacances car ma source se tarit. Pendant ces périodes, je préfère ajouter un abstract même vieux de 15 jours que laisser la page en l'état.

J'avais fait à une époque différents tests, et il me semble que google va mieux visiter le site et les liens de la page d'accueil quand elle est modifiée régulièrement.

Je ne veux tromper personne, juste essayer de faire prendre aussi vite que possible les nouvelles pages et les nouvelles images.

Et crois-moi le plus dur ce n'est pas le référencement (pardon Olivier), mais l'écriture des pages.

amicalement
jmm

PS J'ai compris, il y a très peu de temps, pourquoi un des messages que j'avais mis en 1999 sur un site de boomerangs était très bien référencé et sortait facilement dans Google, l'auteur du référencement de ce site était celui de WRI... c'est ça ?
 
WRInaute discret
Nouvel élément, trouvé sur https://www.google.fr/webmasters/guidelines.html (autant aller chercher l'info à la source :o) :
Vérifiez que votre serveur Web supporte l'en-tête HTTP « If-Modified-Since », qui permet d'indiquer aux robots Google si le contenu de votre site a évolué depuis leur dernière exploration. En supportant cette caractéristique, vous réduirez la largeur de bande et l'utilisation de vos ressources.

Je crois que la réponse à toutes nos questions est là. Enfin je n'exclue pas l'idée de la comparaison avec le cache cela dit.

Yvan.
 
WRInaute passionné
Et pourquoi pas faire un include (PHP) d'un texte dont le nom serai composé de la date
MM/JJ style 0113.txt ou 0113.htm pour aujourd'hui

Ce qui permet de faire une mise à jour automatique, et de laisser le serveur le gerer.
Tous les jours le moteur peut trouver quelque chose de different.
 
WRInaute discret
Kmacleod a dit:
Ce qui permet de faire une mise à jour automatique, et de laisser le serveur le gerer. Tous les jours le moteur peut trouver quelque chose de different.

Mmmh, à part consommer de la bande passante, à quoi cela sert-il pour les visiteurs ? :?:
 
WRInaute passionné
Kmacleod a écrit:
Ce qui permet de faire une mise à jour automatique, et de laisser le serveur le gerer. Tous les jours le moteur peut trouver quelque chose de different.

Mmmh, à part consommer de la bande passante, à quoi cela sert-il pour les visiteurs ?
Ben pour mon site, cele permet d'afficher la blague du jour, sans être obligé de faire du ftp quotidiennement :wink:
 
WRInaute impliqué
frisons

Whoa ou whao : lire tout ceci fait frissonner. Comment Google traite-t-il le site que je represente ici relativement bien (je n'ai pas eu encore de 'resultats' dance) alors que si nous mettons a jour toutes les semaines, c'est le contenu de certaines pages, la creation d'autres et, bien peu souvent, la page Index.... :?:

Mise a jour du contenu pas du contenant, ce nous semble elementaire ; peut-etre sommes-nous naif de respecter les visiteurs :?: Ceci etant, on se plaint pas trop de la freqentation, importante pour une page perso devenue.... Mais ce n'est pas le sujet.

vanillefraise dit
Mmmh, à part consommer de la bande passante, à quoi cela sert-il pour les visiteurs ?

- Oui : ce type de question est tout a fait justifier et je suis heureux de la lire. Sur un autre forum de developpeurs et webmestres, j'ai l'impression que ce qui importe est du faire du chiffre ; par des popups, du flash, des pubes, du casino et je ne sais quoi encore. J'espere ne pas etre tombe, ici, sur ce genre de.... genre quoi... :D
 
WRInaute discret
Je ne vois pas dans quelle direction tu souhaites aller MagiX, mais le sujet était plutôt : quand est-ce que Google considère que ma page est mise à jour ? Cela pour savoir comment lui indiquer qu'une page a changé. Le but n'est pas de modifier toutes les pages pour lui faire croire que le site arrête pas de changer et qu'il est drôlement bien, mais plutôt pour lui dire qu'il faut qu'il mette à jour cette page dans son index !
Kmacleod, je pense que ça ne marchera pas. A moins qu'elle soit justement sur ta page index (qui est plus souvent mise à jour). Cela dit, quel est l'intérêt ? L'internaute tombera sur ta page en tapant 'blague' ou quelquechose dans le style, pas en tapant les mots contenus dans ta blague. Donc j'y vois pas d'utilité. Par contre si tu as des pages qui recensent les titres de tes blagues ou quelquechose qui pourrait être modifié souvent, là je pense que c'est important, car le contenu change réellement. Comme si dans un annuaire tu ajoutais un site ou une rubrique, il est important que la page soit mise à jour rapidement.
Enfin bon, après tout ça, on ne sait tjs pas comment fait Google...
 
WRInaute impliqué
oups

Oups. D'abord, un petit bug (?) Je ne recois pas par email les avis de reponses ; d'ou mon retard.

Oups bis : je vois que j'avais interprete autrement ce topic et, donc, avas repondu a cote. Merci donc Yvan de remettre les choses en ordres. Pour l'essentiel, nous sommes tout a fait d'accord.

Au fil du temps passe avec vous ici, on verra bien la ou on diverge ou pas...

Ceci me semble tout ce qu'il y a de plus constructif ; non ?
 
Discussions similaires
Haut