Multilingue et duplicate content

WRInaute occasionnel
Bonjour,

Le site de mon profil n'a que 24 pages référencées dans google (d'après MyWRI). Je bloque sur ce chiffre depuis 4 mois (site en ligne depuis presque 6 mois. J'ai continuée à optimiser mes pages en septembre pour tenter d'améliorer les choses :
- url rewriting
- gestion dynamique des titres de pages
- gestion dynamique des descriptions de pages

J'ai un doute sur un point. Ce blocage ne serait il pas dû à la version anglaise de mon site ? Je m'explique.
Dans un répertoire /photos/ j'ai les fichiers php de la version française.
Dans un répertoire /photos-en/ j'ai les fichiers php de la version anglaise.

Souhaitant bien faire les choses, les fichiers php ont un code php identiques entre le français et l'anglais. Seul le fichier de langue change, et donc la langue de ma page.

Est ce que google prend en compte uniquement le nom des pages, ou analyse t'il le nom, le contenu et l'url complète du site ?

Merci pour vos conseils. J'aimerai bien décollé de ce chiffre 24. :wink:
 
WRInaute passionné
J'espère qu'il s'attache plus au contenu visible qu'au code complet... mais j'ai un doute.

Il y avait déjà eu des discussions à ce sujet sur WRI (comparer deux pages), mais je suis pas sur quelles aient apporté des éclairssicement sur la méthode employée par Google.
 
WRInaute discret
Les termes utilisés dans l'url de vos pages sont également pris en compte. Mais dans quelle mesure ? Difficile à dire. Seulement, les résultats de Google trahissent souvent la chose en mettant en gras les temes recherchés dans les url.

Si vous décidez de changer le nom de vos pages, utilisez de préférence un "-" plutôt qu'un "_" pour séparer les mots utilisés dans vos URL. Ni les coller bien entendu.

Pour un annuaire français/néerlandais, cela m'a amené à faire une table de correspondance.

Bon courage.
 
WRInaute discret
Dans un de mes projets de type annuaire, la table des sociétés référencées comportait trois champs indexés (sans doublons). Je plaçais dans ces champs le nom de mes pages "virtuelles" en tenant compte du contexte linguistique.

Exemple :
Code:
id      fr                nl             en          contenu transversal
1       voiture.asp       auto.asp       car.asp     blablabla...
Ensuite, ces 3 champs étaient utilisés comme ID pour retourner la fiche de la société dans une page dynamique. On rend le tout transparent en utilisant l'url rewriting.

Un lien de type :

http://site/fr/auto.asp

cachait :

http://site/show?langue=fr&page=auto.asp

D'autre part, sur la page décrivant la société, le placement de liens permettant d'afficher la page en cours dans une autre langue devenait un jeu d'enfant.

Dans l'espoir de m'être correctement exprimé, bien à vous,

Serge
 
WRInaute discret
Selon azimov, par défaut, la langue de ses concepteurs :D

Mais la question ouvre un sujet intéressant (pour moi en tout cas). Bien qu'encore novice dans le domaine du référencement au regard des familiers de ce site, je pense que notre moteur utilise des dicos pour permettre la recherche de termes similaires, qu'il intègre les habitudes et même les fautes d'orthographe. Et ce dans plusieurs langues. Je n'ais pas l'impression qu'il ait des préférences pour peu que les pages soient codées correctement. Bonne déclaration du charset, etc. Mais l'anglais, avec un jeu de caractère limité (26 lettres sans accents), doit lui rendre la vie plus facile que le traitement des 6.500 caractères chinois (forme simplifiée en plus).

Ce qui pique ma curiosité, c'est sa capacité ou non, à reconnaître un contenu traduit. Nous pourrions supposer qu'un texte faisant l'objet d'une traduction doit représenter un intérêt pour le site qui hébergerait l'ensemble ou de manière générale, la communauté web si ce dernier a été traduit sur d'autres sites. Et dans la positive, quel serait l'impact sur le calcul du PR (si tant est que ce dernier soit encore définissable).

Intégrer cette notion pourrait le servir mais suppose l'intégration de modules cognitifs dépassant la simple comparaison de mots clés. Si quelqu'un en sait plus sur le sujet, je serais très heureux d'en savoir plus...

Bien à vous,
 
WRInaute occasionnel
C'est un bon plan le coup de la table de référence. Mais au final est ce une mauvaise solution d'avoir juste le nom d'un répertoire qui permet de différencier les pages anglaises des pages françaises ?

Les mois qui viennent me le diront peut être.
 
WRInaute discret
Disons que si le nom du répertoire est l'acronyme de la langue, autant avoir un nom de page utilisant des mots clés.

Car ce qui importe finalement, c'est que l'url comporte des éléments de recherche. Que ce soit le répertoire ou le nom du fichier, c'est juste une question d'organisation et de gestion du site.

De toute façon, l'essentiel, c'est le contenu de vos pages :wink:
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut