optimiser l'indexation sur un serveur Domino

  • Auteur de la discussion Auteur de la discussion Gerem
  • Date de début Date de début
Nouveau WRInaute
Bonjour tout le monde, j'ai en fait plusieurs questions concernant l'interaction entre Google (et les autres moteurs de recherches) et un site web (base Notes) hébergé sur un serveur Domino (R5/R6).
1- j'aurai voulu savoir quel était le comportement d'un serveur Domino (R5/R6) face à une tentative d'indexage par Google ou un autre moteur de recherche ?
2- étant donné que le serveur Domino génère du code HTML à la volée et que les URLs qui en ressortent sont en général de l'ordre de 128 caractères (voire plus), y'a t-il un moyen d'optimiser l'indexage des pages d'une base Notes ?
3- question qui découle de la 2ème, est-ce q'une URL trop longue ou complexe (slash et chiffre à tout vas) est-elle un frein à l'indexage ou pas ?
4- au final, quels paramêtres appliquer au serveur Domino pour optimiser l'indexage ?

Merci d'avance pour toute vos précisions ou redirections sur un/des sujet(s) similaire(s).

Jérémie
 
WRInaute passionné
En gros: Google et autres robots de moteurs naviguent comme avec un navigateur texte donc des qu'il est question de cookies, flash, javascript,... ca va poser des problemes (surtout pour suivre des liens).
Sinon le passage de robots peut charger le serveur, et parfois fortement (genre 2 visiteurs et 10 robots a un moment).
Les URLs a multiples parametres: pas terrible. Et avec des identifiants de session (donc qui changent chaque fois) ca ne va plus. Le mieux c'est des URLs pas trop longues contenant des mots importants séparés par autre chose que des underscores (chercher un coup: identifiants de session, URL rewriting sur WRI comme dans l'ovale en haut).
 
Nouveau WRInaute
En effet il y'a un identifiant, pour être plus précis, le serveur détecte si l'utilisateur est un anonyme ou un utilisateur capable de s'authentifier.
Pour ce qui est de la frameset, le site à été développé il y'a 4/5 ans et à l'époque il y'avait de l'abus de frameset.
Est-ce que l'identification empêcherait l'indexage ? Ou tout du moins le ralentit ?
 
Olivier Duffez (admin)
Membre du personnel
oui, l'identification peut tout bloquer pour les moteurs... il faut la faire par des cookies par exemple
 
WRInaute impliqué
Un petit mot au passage. Domino n'est pas vraiment fait pour héberger un site web ouvert au public, c'est avant tout un outil pour créer des intranet et extranet et faire du groupware.
 
WRInaute impliqué
J'ai déjà eu à gérer ce problème, mes sites ont été longtemps hébergés sur un serveur Domino.

1- j'aurai voulu savoir quel était le comportement d'un serveur Domino (R5/R6) face à une tentative d'indexage par Google ou un autre moteur de recherche ?
L'architecture de Domino oblige à abuser des frames pour arriver à faire ce que l'on veut, donc cela pose d'énormes problèmes d'indexation avec les moteurs de recherche.

2- étant donné que le serveur Domino génère du code HTML à la volée et que les URLs qui en ressortent sont en général de l'ordre de 128 caractères (voire plus), y'a t-il un moyen d'optimiser l'indexage des pages d'une base Notes ?
Oui, mais ce n'est pas facile, pas documenté du tout et il faut des bons spécialistes pour y arriver.

3- question qui découle de la 2ème, est-ce q'une URL trop longue ou complexe (slash et chiffre à tout vas) est-elle un frein à l'indexage ou pas ?
Oui, clairement. La solution est de faire de l'url rewriting (avec la version windows, ce n'est pas forcément très simple, mais on y arrive).

4- au final, quels paramêtres appliquer au serveur Domino pour optimiser l'indexage ?
Si c'était juste une question de paramètres... L'url rewriting permet de régler la plupart des problèmes (google arrive assez bien à indexer les url domino, ce sont les autres moteurs qui n'aiment pas).
Le principal problème c'est de se passer des frames... Et là, c'est pas simple, mais alors pas simple du tout.

C'est pour cela que j'ai abandonné Domino pour tout passer en php ... :(
 
Nouveau WRInaute
optimiser l'indexage sur un serveur Domino

Je gère un site qui tourne depuis 5 ans sur du Domino Web Server (R5.x à ce jour) :
- mes ~2000 pages sont ouvertes au public sur internet et sont plutôt bien indéxées par les moteurs majeurs
- 2/3 de mes pages sont gérées dans des bases Notes - 1/3 en fichiers html classiques
- je n'ai aucune frame nulle part (mais quelques <iframe> ...)
- j'utilise le groupware Lotus Notes pour la gestion de mes contenus et leur workflow de mise en ligne + gestion abonnement et emailing Newsletter
+ gestion des contacts entrants + recherche intrasite etc ...

Revenons au référencement, voici mes constats par rapport au critère URL pour l'indexation :
- les URL complexes bloquants sont ceux générés par défaut par le serveur,
- les fameux identifiants ne sont pas des ID de session mais des ID d'éléments de structure Lotus Notes (pas grand chose à voir avec l'accès Anonymous ...)
- lorsqu'ils ne sont pas composés de "(slash et chiffre à tout va)", les URL sont très peu parlants car les fameux éléments de structure ont été
affublés de noms techniques par les développeurs (faute de précision dans le cahier des charges ...)

Mes axes d'optimisation pour passer des mots clé dans les URL (testé pour vous - j'y travaille en ce moment même avec les équipes de dev -
sans passer par de l'URL rewriting infaisable - même mes admins Notes on jeté l'éponge) :
- définir une redirection contenant des mots clé vers la base Notes sur le serveur (plusieurs redirections possibles vers la même base)
- donner des noms contenant des mots clé aux éléments de structure Notes (un élément pouvant avoir plusieurs alias)
- définir un champ de contenu renseigné par les webmasters éditoriaux comme clé d'accès aux documents web

Au total transformation de mes URL donne ceci :

AVANT (structure la plus courante des URL Domino) :
*http://www.mon-site.com/<chemin-de-la-base-Notes>/<ID-de-vue-Notes>/<ID-de-document-Notes-pour-le-web>?<action-domino>&<parametres-eventuels>*
APRES :
*http://www.mon-site.com/<redirection-vers-base-Notes>/<Nom-Vue-Notes>/<Texte-clé-d'accès-document-Notes-pour-web>?<action-domino>&<parametres-eventuels>*

Et à titre d'illustration, un exemple :
AVANT:
*http://www.mon-site.org/prod/web/home.nsf/48cb625401cc272b4125673c0028eb92/eb1a87690d0256054125673c002f764c?OpenDocument&Query=1&Seq=2*
APRES :
*http://www.mon-site.org/ma-redirection/ma-vue/mon-document?OpenDocument&Query=1&Seq=2*

Note :
- /ma-redirection/* -> /prod/web/home.nsf/*
- on peut faire sauter l'<action-domino> (OpenForm, OpenDocument, etc ...) s'il n'y a pas de paramètres derrière,
ce qui pour l'exemple donne un bel URL communicant :

*http://www.mon-site.org/ma-redirection/ma-vue/mon-document*

Magique non ?

Mais il est vrai :
- travail de définition à faire très en amont et à suivre étroitement avec les developpeurs pour la mise en place ...
- et attention (avant de s'engager dans de l'optimisation d'enfer) : Lotus/IBM n'assure plus la maintenance de cette génération de serveurs au delà de fin 2005 ...

Il faut passer à du STANDARD :!:
 
Nouveau WRInaute
domino et google

Bonjour ,
Je viens de lire par hasard votre post en cherchant quelque chose sur google.

Premier point , je suis l'auteur de coventya.com (la premiere version) et à l'époque le probleme google n'était pas dans le cahier des charges.

Domino est compatible avec google , la preuve un de mes sites Domino : tableauxenligne point com a près de 100 000 pages indexées

Ceci passe principalement par la gestion des caches des navigateurs et du moteur http Domino avec les nouvelles fonctions de la R6

Je peut mettre en place cette technique dans la base coventya.nsf si vous le souhaitez
 
Nouveau WRInaute
Re: domino et google

Bonjour

Comment êtes vous positionné sur les mots clé de tableauxenligne point com ?

Ce serait intéressant de savoir en effet comment vous vous y êtes pris avec la R6 !

En particulier si vous pouvez explorer la fameuse 'substitution d'URL' et autres nouveautés de la R6 ce serait vraiment bien, tenez nous au courant.

Pour ma part je suis toujours en R5 et compte passer en R6 qui m'a-t-on dit apporte un vrai plus au niveau performance, en particulier lorsqu'on sollicite beaucoup de puissance de calcul au serveur dans la construction des pages, en particulier pour leur optimisation pour le référencement ...

Enfin, je confirme : Domino est bien compatible avec Google puisque c'est un serveur web http comme un autre ... seulement il y a :

le site Domino par défaut/natif qui présente des facteurs bloquants pour le référencement (frames, URL complexes, ...)

et le site Domino optimisé (par des développements spécifiques) qui répond à un besoin et à des objectifs 'métier' de référencement / positionnement

Tenez nous au courant pour coventya.
Merci!
 
Nouveau WRInaute
il y a 85000 pages , tableauxenligne ne prend pas de www au début (choix perso)

concernant les differentes astuces à employer sur Domino, cela pourrait faire l'objet d'un article, Article que je n'ai pas le temps d'écrire en tant que freelance. Et il faut reconnaitre que c'est peut etre un peu plus compliqué que sur les autres systèmes.
 
Nouveau WRInaute
j'en ai écrit un d'article (voir sur le site Abondance), plus axé R5 ... ce serait peut-être bien de compléter avec les nouveautés R6 !
qu'en pensez vous ?
 
WRInaute discret
Bonjour,
je suis à sur le développement de mon 4ème site en Notes (V6.5).
Pour les problèmes de frames, je vous conseille d'utiliser des sous-masque et de placer le menu et autres entêtes dans un masque avec un tableau qui contient le sous-masque.
Pour les URL, j'utilise la technique de l'ouverture des docs par la nom de vue et ca marche très bien.
 
Discussions similaires
Haut