Google fait-il une différence entre le HTML et le PHP ?

WRInaute discret
Salut,

Voila, je me demande si le crawler de Google (pas le Full-Crawler (lui, comme son nom l'indique, il visite tout ;-) ), juste le robot qui passe entre les Full-Crawl) fait une différence entre les page en HTML et en PHP.

Je vous explique mon cas : La page d'acceuil de mon site est une page contenant toute une série de liens (un cinquantaine) vers différentes zones de mon site. Hors la plupart de ces liens pointent vers des pages HTML, alors que seuls 5 ou 6 liens pointent vers des pages en PHP.

Hors le "petit-crawler" de google passe essentiellement sur les pages en PHP (a titre indicatif, du 9/11 au 22/11, 93 pages ont ete crawlées... 92 etaient en PHP ! (Chiffres obtenus a partir des log)) .

En outre cette distinction n'est pas liée à la nouveauté de la page :
1) durant la periode de test indiquée ci-dessus, la page d'accueil a contenu des liens vers des pages entierement nouvelles (Nouvelles pages mises en ligne le 12/11).
2) certaines des pages PHP visitées sont connues par Google depuis longtemps

Donc voila mes observations.

Avez vous déja vu ce genre de phénomènes ? (en tout cas pour les personnes ayant des sites avec des pages HTML et PHP) ??

Fruge.
 
WRInaute discret
A première vue chez moi il ne fait pas la différence, j'ai les deux types de page passée en revue par le fresh bot. et que ce soit a partir d'une page php vers html ou inversément.
 
WRInaute passionné
Anonymous a dit:
Comment fais-tu pour savoir que google passe sur tes pages HTML ?
Les stats du serveur sont utiles...


Sinon, une hypothèse serait que Google considererait que les pages php sont dynamiques dont plus susceptible d'évoluer --> visite plus fréquente tandis que lespages html sont mises à jour moins souvent.

François
 
WRInaute passionné
perso je ne pense pas que google fasse cette distinction.. j'ai exactement les memes pages en php et en html et il passe sur les deux versions au meme moment...
( http://www.surf4all.net/surf-report.html
et http://www.surf4all.net/modules.php?name=Report par exemple)

si ya des diff pour toi entre php et html, c'est peut etre parce que la frequence de tes mises à jour de ces pages est différente non ?
car si tu change chaque jours les .php et une fois tous les 20 jours les .html c'est normal que google aille tous les jours sur les .php et moins souvent sur les .html ...
 
WRInaute discret
Salut,

Mitirapa a dit:
perso je ne pense pas que google fasse cette distinction.. j'ai exactement les memes pages en php et en html et il passe sur les deux versions au meme moment...
( http://www.surf4all.net/surf-report.html
et http://www.surf4all.net/modules.php?name=Report par exemple)

Oui, mais (si je ne me trompe), ta page HTML est en fait une page PHP (URL Rewriting). Alors peut etre que Google gere ca comme une page HTML (ily a peut etre en particulier une différence au niveau de la date de création du document : bien que ".html", Google voit que le document vient d'etre créée (j'en sais rien, c'est juste une hypothese...))

Mitirapa a dit:
si ya des diff pour toi entre php et html, c'est peut etre parce que la frequence de tes mises à jour de ces pages est différente non ?

Oui, j'y ai pensé aussi, à ce facteur... A vrai dire, sur la periode de temps dont je viens de parler, j'avais pas mal touché aux pages PHP, donc ca va dans ton sens (mais bon, j'avais aussi touché à certaines pages HTML)...

Mais en fait, ce phenomene, je l'ai constaté petit a petit depuis bien plus longtemps ... en particulier à des periodes où le secteur PHP etait en stand-by. Donc le lien avec les mises a jour, je n'en suis pas convaincu pour le moment... :?

De toute maniere, je viens de faire une mise a jour totale de mon site (hier), et des pages HTML (2° niveau) ont ete bien modifiées, donc on verra bien le comportement de Google. Je sais déja qu'il est passé ce matin sur certaines des pages PHP, donc dès que j'aurai les log, je pourrai voir s'il est allé farfouiller sur les pages HTML, ou s'il s'est contenté des pages PHP...

(Un autre test que je pourrai faire consisterait a changer l'extension d'un page HTML --> PHP pour observer le comportement de Google...)

A plus,

Fruge
 
A
Anonymous
Guest
google ne passe que les 2 premieres varaibles du PHP

En tout cas c'est ce que j'ai constaté sur google
pour une url du genre http://www.mapage.com/index.php?variable1&variable2
Google arrive à indexer le page
Mais si l'url c'est index.php?variable1&variable2&variable3
Là google n'atteind pas cette page.


Ps: mon site http://www.free-scores.com
cartonne grave sur google, pas de problème de référencement, 8000 visiteurs / jours
MOn secret à vrai dire : l'utilisation des variables php comme titre dans mes meta <title>.

au passage allé faire un tout si vous êtes musicos (partitions gratuites et payantes pour tous les instruments)
@+

Victor
 
Discussions similaires
Haut