Pas de code source visible => Google 1ère page uniquement

WRInaute discret
Bonjour,

Sur le site http://www.coste-du-rhone.com j'ai un souci visiblement, mais impossible de déterminer la cause :
http://www.coste-du-rhone.com a un PR de 5
(en fait, la page d'accueil est www.coste-du-rhone.com/accueil.html via l'url rewriting, ou bien www.coste-du-rhone.com/index.php?page=accueil)

Et toutes les autres pages du sites, liées depuis cette page ont un PR à 0 ! Y compris www.coste-du-rhone.com/accueil.html QUI CONTIENT LA MEME CHOSE...
et on constate sous IE en faisant clic-droit/affiche source qu'il ne passe rien !!
Ce qui explique le PR? Google ne trouve pas de code source non plus ?

Par contre, EN TAPANT l'adresse plutôt qu'en cliquant un lien sur la page, on a la source.
Egalement, on affiche une page, l'affichage du source ne donne rien, on l'actualise via F5 par exemple, et le code est visible...

J'ai plusieurs sites qui me font le même symptôme (www.pharmespace.com) et d'autres construits sur les mêmes bases et où toutes les pages ont un PR (www.snt-voile.org)

Tous ces sites sont en PHP avec structure de type ?page= et URL rewriting.

Merci pour vos éclaircissages.
 
J
JPC
Guest
ben jette ton internet explorer, on voit très bien tes sources html....

et vire tes sessions; ça donne des url du genre :
-http://www.coste-du-rhone.com/index.php?page=gallery/index&PHPSESSID=c8346cd7acd9353d99dc4b5e5418a926

et ça gg il aime pas...
 
WRInaute discret
C'est plus compliqué que ça... heureusement sinon je pense que j'aurais trouvé :roll: (testé avec 3 PC avec IE différents)
Pourquoi certains de mes sites le feraient et d'autres non ?

Je penche plutôt pour l'URL rewriting non ?
Voilà le .htaccess :

Options +FollowSymlinks
RewriteEngine on
RewriteRule ^vin-(.*)-(.*)-([0-9]*)\.html$ index.php?page=$1&auto_vin=$4 [L]
RewriteRule ^([0-9a-zA-Z_\]+)\.html$ index.php?page=$1 [L]

ErrorDocument 404 /404.html
ErrorDocument 403 /403.html

Another idea ?
 
WRInaute accro
WRInaute discret
C'est bien le problème !
Google s'arrête systématiquement sur la page d'accueil, sans jamais suivre les liens dans la page, et il y en a... d'où mes recherches sur le source, qui font apparaître un problème sur plusieurs PC : aucun source dispo... Alors que sur certains de mes autres sites, le problème n'apparait pas ; certains sites à faible contenu (www.ecurie-roche.com) voient toutes leurs pages indexées par GG.

Concernant les SESSID, je suis en test sur :
ini_set('session.use_trans_sid', 0);
ini_set('session.use_cookies', 1);
ini_set('session.use_only_cookies', 1);
Mais visiblement, l'hébergeur ne l'accepte pas (OVH) ou alors il y a une autre astuce. Je me vois mal gérer un panier sans sessions...

Sinon je persiste : si c'était un problème sur un seul PC, je pense que j'aurais trouvé. Sans prétention aucune je t'assure.

Merci, je continue de chercher...

EDIT : j'ai viré le SESSID en mettant l'URL complète pour chaque lien de la page d'accueil : ça devrait aller ?
 
J
JPC
Guest
heu l'hebergeur semble ne pas accepter ça sur les mutualisés... à vérifier...

clairement que le bot n'aille pas suer les pages en profondeur, ça ressemble terriblement à un problème de sessid...
google indexe aussi les pages ayant un phpsessid, mais il met + de temps, cest aléatoire...
et je t'assure que je peux afficher tes sources; c'est la source html qui permet de générer la page, si on n'avait vraiment pas accès aux sources, ta page ne s'afficherait pas... Si tu veux vraiment etre rassuré, visite ton site avec netscape...
j'ai déjà vu ce genre de bug avec IE y'a qq temps; installe les patchs ;-)
 
WRInaute discret
Oui je suis en mut chez OVH...
Pour les SESSID, j'ai mis l'URL absolue sur presque tous les liens de la page d'accueil, je n'ai donc plus le SESSID (il en reste mais pour des pages protégées par login : est-ce grave, est-ce que du coup le facteur aléatoire apparait tout de même ?)

Pour le problème cité, oui c'est connu : mais quand cela arrive, tu ne peux *jamais* voir de sources. Il suffit ensuite de vider le temporary internet files.
Toutes mes machines ont toujours tous les patchs : j'ai testé avec 3 machines (2 XP + 1 W2000Srv en IE6, et mon client avec IE5 en W2000) : j'ai le problème sur LES MEMES pages... et certaines sont OK et d'autres non... et toujours les mêmes...

Effectivement un test avec Opera m'a oté le doute, tout fonctionnait bien.

Je n'ai donc presque plus de SESSID, on verra bien la suite...

Merci.
 
WRInaute impliqué
C'est vrai que c'est amusant qu'aucun source ne soit visible sous IE.

As-tu essayé en virant l'ancre qui est placée entre le head et le body ?
En virant le commentaire avant la balise <html> ?
En passant le code au validateur W3C ?
En ne mettant pas les caractères accentués directement dans le source ?
En m'envoyant une caisse panachée de vos différents vins ? :roll:
 
WRInaute discret
Alors j'suis pas bourré et tu as aussi vu le problème...

Tous les entêtes, y compris l'ancre, sont dans un fichier commun, qui est appellé à chaque fois : le problème devrait apparaitre sur toutes les pages; ce qui n'est pas le cas (uniquement certaines pages, pas de problèmes si accès en tapant l'URL ou en faisant F5).
Chiant hein ?

Pour la caisse de vin, c'est fait. Par contre je n'avais pas ton adresse donc je me la suis envoyée.
 
Discussions similaires
Haut