Influence des sessions PHP

WRInaute passionné
Bonjour à tous,

J'ai découvert ce site récemment et y ai passé quelques heures à la recherche d'un fil traitant de l'influence des sessions PHP sur le référencement Google.

Je m'explique:
Mon site (PR4) est un site dynamique pour agences immobilières. J'avais développé une version bilingue en m'appuyant sur les sessions PHP pour pouvoir changer la langue de l'interface. Il semble que google n'ait pas apprécié car de 80 pages indexées, je suis retombé à 2 :( - le PR est resté à 4, ouf!

J'ai bien sûr remis tout en l'état, en y ajoutant l'URL rewriting qui pourrait peut-être m'aider à récupérer quelques pages.

Auriez-vous des conseils quant-à l'utilisation des sessions ?

Merci pour toute info.

Dan
 
WRInaute passionné
Merci Gustav,

J'avais cherché "sessions php" et n'avais pas trouvé de véritable réponse.
Au moins j'ai appris où était le problème... :?

J'espérais récolter quelques suggestions utiles.

Dan
 
Nouveau WRInaute
Bonjour,

Après avoir moi aussi passé beaucoup de temps à chercher pourqui Google ne voulait pas de mes pages, je me suis résolu à spécifiquement désactiver les sessions pour les bots. En fait le GoogleBot ne supporte pas du tout les ?PHPSESSID=.... ajoutés automatiquement à chaque url. En 2 mois j'avais eu environ 30 accès GoogleBot et depuis 2 jours, ça s'envole avec le full crawl je suis à plus de 300.

Ci-joint un bout de code php qui facilite bien la vie...

// Spider/Bot pour référencement
$spiders = array("Googlebot", "crawler", "curl", "Girafabot","ia_archiver","MediBot","Robot","VoilaBot","W3C","ZyBorg");
$from_spider = FALSE;
foreach($spiders as $Val)
{
if (eregi($Val, $_SERVER["HTTP_USER_AGENT"]))
{
$from_spider=TRUE;
break;
}
}

// Session
if(!$from_spider)
session_start();


Bonne continuation
A+
 
WRInaute discret
hetzeld : est-ce que tu as testé ce code ? Ca marche ?... PArce que je l'ai mis sur toutes mes pages, alors ça serait bien que ça marche :lol:
Si j'ai bien compris mes logs, j'ai vu un max de passages de googlebot aujd'hui sur mon site !!! YOUHOUHOU si c'est le cas, un grand merci à tous pour vos coups de main !
 
WRInaute passionné
Mr Fab,

Je n'ai pas utilisé ce code. J'ai préférer revoir le design fonctionnel pour complètement m'affranchir des sessions.
Bien m'en a pris car je suis à près de 1400 passages de GoogleBot depuis le début du mois. :lol:

Dan
 
WRInaute impliqué
modifié votre .htaccess

rajouter dans votre .htaccess (ou bien dans la conf d'apache)

php_value session.use_trans_sid 0

cela empechera l'ajout automatique du PHPSESSID dans vos url et tout sera pour le mieux dans le meilleur des mondes.

J'utilise des sessions sur quasimment tous les sites que je fais et grâce au code ci-dessus, je n'ai aucun problème pour le référencement ...

la preuve sur mon site de la Côte d'Azur, plus de 10 000 pages référençées alors qu'il y a des sessions.

question :
est-ce que googlebot accepte les cookies ?
perso je ne pense pas.
 
WRInaute discret
Il a déjà été question de tout dans un autre post, car les sessions sans "?PHPSESSID=..." ne fonctionnent que si l'utilisateur a activé ses cookies. Certes la majeure partie des gens les ont, mais ce n'est pas toujours vrai.
De plus, enfin sur mon site, j'ai de nombreux pbs car de temps à autre l'info de session (pas l'identifiant, mais bien les variables stockées) disparaissent. Pas très joli car cela change les couleurs du site.

Pour Hetzeld, ce que je te conseille c'est d'utiliser l'URL Rewriting avec une réécriture du type :
ReWriteRule [a-z*]/mapage.html mapage.php?langue=$1
avec bien sûr des pages appelées en HTML comme ceci : /fr/mapage.html ou /us/mapage.html

En ce qui concerne le système de rom33, j'hésite franchement à mettre quelquechose dans le genre. Google est très pointilleux en ce qui concerne le cloaking (page différente si c'est le GoogleBot qui regarde ou si c'est un internaute), car GoogleBot se fait passer parfois pour IE(5.0). Or si jamais il passe en disant "j'accepte pas les cookies en tant que IE(5.0)", ben tu risques d'avoir l'identifiant de session dans tes liens, et donc 2 pages différentes et donc de plus être référencé par Google. Enfin je dis ça, mais vu que vous n'affichez pas les identifiants quand y'a pas de cookies, je crois que tout devrait aller bien. Sauf pour les pauvres internautes qui désactivent les cookies.

Perso j'essaye de mettre un identifiant dans le style xxxxxx_mapage.html, mais j'ai peur que Google boude en voyant que les identifiants changent sans arrêt... Personne n'aurait d'infos là-dessus ? Parce que je me demande s'il va prendre ça comme du cloaking ou pas...

Yvan.
 
WRInaute passionné
Yvan a dit:
Pour Hetzeld, ce que je te conseille c'est d'utiliser l'URL Rewriting avec une réécriture du type :
ReWriteRule [a-z*]/mapage.html mapage.php?langue=$1
avec bien sûr des pages appelées en HTML comme ceci : /fr/mapage.html ou /us/mapage.html

Merci Yvan,

C'est en effet l'URL rewriting qui est venu à la rescousse. Pas tout à fait sous la forme que tu préconises... mais cela marche !

Dan
 
WRInaute discret
bonjour enieme,

voila mon probleme :

== > g effectué de l'URL REWRITING mais les PHPSESSID apparaissent tjrs sur des liens du style "http://www.monsite.com/annuaire/antiquaires.html?PHPSESSID=e22177513876f3d95674bd531e"

== > je voudrais bien détecté les spiders mais mes pages sont bilingues et les sessions servent à mettre le texte en fr ou uk, donc si plus de sessions, plus de référencement du site uk.

== > g essayé la solution suivante :
Code:
php_value session.use_trans_sid 0
mais ca me met une erreur 500.

Qqun a-til une solution ?

Dan, j'ai cru comprendre qu'à l'époque ou tu n'étais qu'un jeune googler comme moi (ca date) tu avais eu le meme probleme. Comment as-tu fais, svp ?

Merci.

PS : J'en profite pour demander ce que signifie l'erreur 301 ?
 
WRInaute passionné
TT,

On va commencer par le plus facile: 301 n'est pas une erreur mais le code d'entête HTTP correspondant à une redirection permanente.

Pour m'affranchir du problème des sessions, j'ai utilisé la "force brute", à savoir : les supprimer purement et simplement.
Il faut te dire que de toutes manières, si les sessions sont indispensables pour consulter la partie anglaise du site, pratiquement aucun moteur ne pourra l'indexer, et pas seulement Google.
A toi de voir comment tu peux tourner cela différemment. Tu as deux possibilités: par programmation ou en maintenant une arborescence séparée.
Pour mon site immo, j'ai préféré la programmation combinée avec des règles de réécriture d'URL et cela fonctionne plutôt bien.

Par exemple, chaque page de mon site est visible en deux langues, avec le français comme langue par défaut.
La page d'accueil est index.php en français et welcome.php en anglais. C'est en fait le même script qui est appelé, avec dans le second cas un paramètre lang=EN avec une simple règle de réécriture comme:
Rewriterule welcome.php index.php?lang=EN

Chaque fichier php est en fait un programme remplissant des templates (patTemplate) selon la langue choisie. L'ensemble utilise 2 modèles DreamWeaver (un pour chaque langue avec la barre de nav) ... cela fait des templates (php) dans des templates (html) mais cela marche bien.
Une page typique est générée en moins de 100 millisecondes sur mon portable. :wink:

Dan
 
WRInaute passionné
Bonsoir,

Je suis désolée pour ce HS dans une discussion très sérieuse, Dan...
mais je n'ai pas pu résister :oops:
J'ouvre le topic, comme bien souvent, je jette un rapide regard à l'avatar et je commence ma lecture sans regarder la date et...
je lis :
hetzeld a dit:
Bonjour à tous,

J'ai découvert ce site récemment et y ai passé quelques heures à la recherche d'un fil traitant de l'influence des sessions PHP sur le référencement Google.

Le choc 8O avant que je ne me rende compte de la date du message !!!
Et ensuite l'éclat de rire quand j'ai lu la première réponse que tu as eue !!! :lol: :lol:

Amicalement,
Monique
 
WRInaute passionné
Monique,

C'est vrai que le début de ce message remonte à 6 mois... Depuis, j'ai appris 2 ou 3 choses sur l'indexation de pages avec session php :lol:
Quand on a 20 ans d'informatique derrière soi, on apprend vite, non ?

Cordialement,

Dan
 
WRInaute discret
N'oubliez pas non plus, concernant ces sessions, que si vous ecrivez les adresses complètement dans vos liens, l'id de session ne sera pas affiché. Cela marche comme ça sur www.bedetheque.com et le site est complètement indexé par google. Exemple

N'ecrivez pas :
Code:
<A HREF="mapage.php">lien</a>
ca php ajouterais automatiquement un PHPSESSID=xxxxxxx à la fin dans vos pages

Mais ecrivez
Code:
<A HREF="http://www.monsite.com/mapage.php">lien</A>
Et là, miracle, plus de PHPSESSID, pourtant la session est bien active et fonctionne parfaitement.
 
WRInaute discret
hetzeld a dit:
Par exemple, chaque page de mon site est visible en deux langues, avec le français comme langue par défaut.
La page d'accueil est index.php en français et welcome.php en anglais. C'est en fait le même script qui est appelé, avec dans le second cas un paramètre lang=EN avec une simple règle de réécriture comme:
Rewriterule welcome.php index.php?lang=EN

J'utilise quasiment le meme systeme. En fait, antiquites-en-france (desole pour la pub) pointe sur index.php et french-antique-dealers pointe sur uk.php qui ont pour le premier le meta langue fr et pour le deuxieme le meta langue en. J'ai utilisé l'URL rewriting pour mes pages les plus importantes en anglais comme en français donc j'ai dans l'espoir de voir google référencer les deux, non ?
J'avais auparavant effectué des pages satellites en HTML pour les pages importantes et pouvant être statiques (une dizaine) se situant respectivement dans le répertoire fr et dans le répertoire uk. J'ai préféré les enlever.

Je sais pas si j'ai bien fait.

Concernant la "méthode brutale" comme tu dis, je n'aurais pas le temps de la mettre en place, je suis en stage et j'ai d'autres travaux en cours mais c toujours bon à savoir.

Concernant l'entête 301, a koi est-il du ?
- pages dynamiques ?
- erreur dnas le code ?
- ...

Merci dan pour toutes ce infos.

Sylvain alias Tchinkatchuk, le dernier des mohicans
 
WRInaute passionné
Salut Sylvain,

L'entête 301 n'est pas une erreur. C'est d'ailleurs celle qui est recommandée par Google (et les autres) en cas de déplacement permanent (autre nom/répertoire/domaine) d'une page. Elle n'arrive en général pas toute seule, et tu devrais savoir ce qui l'a causée (sauf si ton hébergeur s'amuse à déplacer tes pages sans te prévenir :lol: )

Dan
 
Discussions similaires
Haut