Cet article fait partie des archives de WebRankInfo : certes, il est ancien, mais complet et détaillé pour son époque. Si vous cherchez d'autres informations, faites une recherche sur le site ou participez au forum. Contactez-moi si besoin.
Crawl et indexation d'un site sur le moteur Orange
Crawl, indexation et fichiers sitemaps
Comme avec les autres moteurs, il faut vous assurer d'avoir un bon maillage interne, c'est-à-dire suffisamment de liens vers toutes vos pages internes. Si vous pensez qu'il suffit de créer un fichier sitemap pour régler le problème de l'indexation, vous vous trompez largement. Pour les détails, lisez mon tuto sur l'intérêt des sitemaps pour le référencement...
Cela étant, Orange supporte le protocole sitemaps.org donc vous pouvez aussi l'utiliser.
En plus d'optimiser les liens internes, une autre façon d'augmenter la fréquence de passage du robot est de procéder à des mises à jour du contenu. En effet, le robot cherche à s'adapter à la fréquence de vos mises à jour. Cela étant, il est totalement inutile de modifier une page de façon artificielle, uniquement pour faire revenir le crawler : ne modifiez vos contenus que si c'est nécessaire.
Fichier robots.txt et nom d'agent
Si vous souhaitez surveiller le crawl du robot d'Orange, ou lui bloquer certaines pages ou rubriques de votre site (via le fichier robots.txt), notez son user agent : VoilaBot.
VoilaBot supporte aussi la directive Crawl-delay du fichier robots.txt, qui permet de définir le nombre de secondes que le robot doit attendre (au minimum) entre 2 visites.
Référencement des actualités
Orange utilise les flux RSS des sites les plus recherchés sur le moteur quand ils existent. Les fils d'info de moins de 48h de ces sites apparaissent ensuite dans la partie actualités en fonction de la recherche de l'internaute et de la popularité du site. Orange prévoit de donner la possibilité aux webmasters de soumettre leurs flux RSS (dans le prochain outil d'indexation) pour étendre les réponses d'actualité à plus de sites.
Référencement des images
Pour faire indexer vos images dans Orange, c'est assez simple dans la mesure où c'est en réalité Google Images qui est utilisé ! Travaillez donc le référencement de vos images dans Google.
Référencement des vidéos
Pour l'instant, vous n'avez pas la possibilité de proposer directement vos vidéos. Orange m'a indiqué que c'était en cours de développement, prévu dans le prochain outil dédié aux webmasters. Mais Orange accepte néanmoins en entrée des flux rss, et travaille actuellement en partenariat avec des plateformes de partage de vidéo comme Dailymotion, Wat, l'INA,... En attendant l'ouverture de l'outil de soumission de vidéos, si vous disposez d'un flux mRSS, envoyez-le ) l'adresse support.voilabot@orange.com
Gérer son indexation dans Orange
Pour contrôler l'indexation de votre site dans Orange, vous pouvez utiliser la commande site: (comme sur Google ou Bing). Par contre il n'existe pas (encore) d'outils pour les webmasters. Orange m'a dit qu'un Webmaster Tools était dans les cartons, mais sans date prévue, d'autres projets étant prioritaires (je vous en reparlerai plus tard dans l'année...).
Si vous avez des problèmes de référencement, vous pouvez poser vos questions par email au support de Voila à l'adresse support.voilabot@orange.com. Vous pouvez aussi les poser dans le forum WebRankInfo ;-)
L'algo SEO du moteur Orange
Comme avec Google, l'algorithme du moteur Orange est bien entendu secret. Les quelques conseils qui suivent proviennent à la fois de mon expérience de référenceur et des informations que le directeur de l'équipe en charge du moteur a bien voulu me fournir. Il ne s'agit pas d'un guide complet d'optimisation SEO spécifique à Orange, mais de certaines informations spécifiques à Orange.
Principaux critères du moteur Orange
Aujourd’hui, l'algo d'Orange intègre "plusieurs dizaines de critères". Parmi les principaux, je peux citer :
- l'utilisation des principales balises HTML
- la fréquence des mots dans le document (attention, lisez la remarque ci-dessous)
- la position des mots dans la structure des documents,
- les positions relatives des mots de la requête dans le document,
- la popularité des pages dans le graphe du web,
- la relation sémantique entre les pages pointantes et les pages pointées
- etc.
En fait, la fréquence des mots dans les documents (tf.idf et normalisations volontairement vulgarisées) n’est plus depuis longtemps un critère à part entière, mais elle intervient dans de nombreux scores composites du moteur de recherche, que ce soit dans les classifieurs bayesiens, les scores de notoriété, les détecteurs de sites et pages miroir ou les scores de spam. De fait, ce critère reste un ingrédient de la formule de positionnement, à utiliser de façon raisonnée pour préserver la portée sémantique et ne pas risquer d’être classifié dans le corpus de spam.
Le social n’est pas encore intégré dans notre algo de ranking (voir ci-dessous les détails).
En plus de ces critères "généraux", Orange utilise d'autres modules comme l’actu, la vidéo, le module « sémantique » et d’autres. Ils sont exploités quand l'algorithme repère une bonne correspondance avec la requête.
Prise en compte des données structurées
Actuellement, le moteur Orange parse les données structurées type schema.org pour les intégrer pour l'instant uniquement dans leur "observatoire du web". D'après ce qu'ils m'ont dit, peu de pages utilisent cela pour l’instant, mais les chiffres évoluent dans le bon sens.
Parmi leurs projets, Orange cherche à mieux catégoriser le web. La prise en compte des données structurées fait évidemment partie de ce projet (je vous en reparlerai courant 2013...). Ainsi, le moteur pourra enrichir les pages de résultats et améliorer la classification de certains types de données sur le web.
Prise en compte du social chez Orange
A proprement parler, le moteur Orange ne tient pas encore compte des réseaux sociaux (à la différence de Google et Bing chez qui les réseaux sociaux jouent sur le référencement naturel). J'ai quand même voulu savoir si Orange avait des projets d'intégration du social dans le search : voici leurs réponses.
Notre stratégie est de proposer du contenu social à nos internautes qui ne connaissent pas encore les médias sociaux, d’agir en coach numérique pour faire découvrir par exemple ce qui buzze sur twitter, ou les personnalités qui sont actives sur Facebook.
Un module social sur la thématique opérateur est en cours de prototypage (les top tweets et hashtags officiels Orange). Il sera visible en production très prochainement.
Nous traiterons ensuite la thématique divertissement (people , tv) où il sera question de proposer les comptes « officiels » des peoples , les hashtags populaires des émissions de TV etc.
Intégrer des réponses personnalisées, issues des univers sociaux de nos clients, n’est pas à l’ordre du jour.
Janvier 2007 : l'annuaire de Voila.fr ferme ses portes
Le 11/01/2007, Voila a fermé son annuaire intitulé le Guide du Web (guide.voila.fr), mais promet une nouvelle version de l'ensemble du site...
Faisant partie des tout derniers gros
annuaires historiques, l'annuaire de Voila a fermé ses portes hier. Cependant, on comprend en lisant les explications fournies par Voila.fr que l'annuaire pourrait revenir mais sous une forme complètement différente, dans la prochaine version du site Voila qui est en préparation :
Le Guide du Web disparaît-il ?
Oui sous sa forme Annuaire de sites classés dans des catégories. Cependant l'environnement de recherche Guide du Web demeure mais pour chaque site proposé vous n'avez plus la possibilité de consulter les autres sites de la même catégorie.
Pourquoi arrêtez-vous le Guide du Web ?
Parce que a recherche par mot-clé est largement préférée par les internautes.
Que se passe-t-il pour les personnes qui ont soumis et payé leur site par la formule Soumission Guide Express ?
L'environnement de recherche Guide du Web demeure. Les utilisateurs de ce service qui ont obtenu l'ajout de leur site le verront toujours présent dans les environnements de recherche Web francophone et Guide du Web.
Que se passe-t-il pour les personnes qui ont soumis et payé leur site par la formule Soumission Url Express ?
Rien ne change. Les utilisateurs de ce service qui ont obtenu l'ajout de leur site le verront toujours présent dans l'environnement de recherche Web francophone pendant la durée d'un an à compter de leur inscription.
On discute de la fermeture de l'annuaire Voila.fr dans le forum.
Septembre 2009 : la vidéo sur lemoteur.fr
On en parle très peu, Google étant dans 99% des discussions, mais il se passe aussi des choses sur Orange et son moteur de recherche. WebRankInfo a pu se procurer quelques informations sur les nouveautés de l'été 2009 et des projets à venir...
Moteur de recherche de vidéos sur LeMoteur.fr
Le moteur de recherche LeMoteur.fr (quel drôle de nom !) dispose d'un moteur de recherche de vidéo (video.lemoteur.fr) qui s'enrichit en fonctionnalités et en contenus indexés : 100.000 vidéos issues de sources sélectionnées (Kewego, TF1, Arte, etc. en plus des contenus d'Orange.fr).
D'après mes informations, les webmasters auront prochainement la possibilité de faire indexer leurs vidéos. Le protocole n'est pas encore décidé (sitemaps vidéo, flux mRSS, etc.). Je vous tiendrai au courant sur WebRankInfo !
Les listes réponses thématiques sur Voila.fr et LeMoteur.fr
Cet été, le moteur a été enrichi d'une fonctionnalité consistant à afficher au sein des résultats une sous-rubrique de résultats thématiques. Par exemple si vous tapez la requête [blanquette de veau] (sans les crochets bien entendu), les premiers résultats (hors liens sponsorisés...) sont regroupés dans un bloc de 3 résultats thématiques "recettes de cuisine". Un lien permet d'en consulter d'autres.
Pour l'instant quelques thématiques sont prises en compte, notamment la cuisine, la santé, les jeux Flash, les logiciels.
D'autres avancées de type "recherche verticale" (ou "recherche universelle") sont prévues d'ici la fin de l'année 2009.
Wikipédia sur Orange.fr
Edit : Orange a supprimé cette rubrique...
Peut-être l'avez-vous remarqué, Orange a signé un partenariat avec la fondation Wikimedia (éditrice de Wikipédia) permettant au portail d'héberger une version "maison" de Wikipédia. Elle est disponible sur wikipedia.orange.fr depuis le 27 août 2009. Contrairement à la version d'origine, celle-ci est en lecture seule (on ne peut ni modifier un article ni en créer un nouveau) et contient des bannières de publicité. Pour l'instant interdite d'indexation aux robots (via le fichier robots.txt et une balise meta robots noindex, nofollow), elle devrait être prochainement indexée selon mes informations... Ce sera un bon cas d'étude sur le fameux duplicate content !
Février 2010 : réponse aux questions géographiques
Le moteur développé par Orange, disponible sur Orange.fr, Voila.fr et LeMoteur.fr vient de mettre en ligne une nouvelle fonctionnalité basée sur son partenariat avec la fondation Wikimedia (éditrice de Wikipédia). Quand un internaute tape une requête (en langage naturel) portant sur des aspects géographiques, le moteur affiche la réponse au-dessus des résultats classiques. Il sait par exemple répondre à des questions comme "Qui est le maire de Toulouse ?" ou "Combien d'habitants en France ?".
Les réponses géographiques du moteur Orange
Grâce aux réponses géographiques du moteur Orange, vous pourrez tout savoir sur les 226 pays du monde, la France, ses 26 régions, ses 100 départements, et ses 36 000 communes en posant simplement votre question depuis la barre de recherche orange. C'est un moyen sympa et rapide pour mieux connaître la France et s’ouvrir au monde !
Pour chaque sujet géographique (ville fr, régions fr, département fr, pays) on peut poser une question sur son infobox et avoir la réponse directement. Par ex pour le sujet "Toulouse", on peut poser des questions sur les prédicats suivants (contenus dans l'infobox) :
- Département
- Région
- Canton
- Code commune
- Code postal
- Maire
- Site internet
- Population
- Densité
- Gentilé
- Superficie
Google et les entités nommées
A noter que Google sait déjà faire ce genre de traitement depuis longtemps (détection des "entités nommées"). Faute de temps, je n'ai pas encore testé par contre si Google sait répondre à des questions aussi détaillées que celles gérées par Orange. Si vous avez des exemples n'hésitez pas à les poster en commentaires.
Mars 2010 : la vidéo
Après plusieurs mois de tests sur son site annexe lemoteur.fr, Orange lance la recherche de vidéos directement depuis son portail orange.fr, généralisant ainsi la recherche universelle dans ses pages de résultats (on parle aussi de moteurs de recherche verticaux, ici la vidéo).
Plus de 400 000 vidéos officielles
Les internautes du portail orange.fr peuvent ainsi consulter plus de 400 000 vidéos officielles issues de plus de 50 partenaires de contenus : archives vidéos de l'INA, Kewego, TF1, Culture Pub, France 2, France 3, Arte, L'équipe, Vidéo Party,...
Grâce au moteur vidéo Orange, les internautes peuvent voir ou revoir des films, séries, emissions de télé, journaux d'actualité, clip musicaux, vidéos drôles, publicités depuis un champ unique de recherche.
Des réponses vidéos au coeur de l'actualité
Pour coller au plus près de l'information, certains sites vidéos sont indexés plusieurs fois dans la journée de 7 h à minuit. A chaque heure de la journée, il est ainsi possible de profiter des dernières vidéos qui ont créé le buzz.
Une recherche de vidéos simplifiée dès la liste des résultats web
En fonction du contexte de la recherche de l'internaute sur le moteur de recherche web orange.fr, des réponses vidéos peuvent apparaître en première page de résultats :
- Si la recherche de l'internaute fait l'actualité, les réponses vidéos apparaissent au milieu des résultats web
- Si l'internaute associe sa recherche à un mot clé lié à du contenu vidéo (ex : clip rihanna, pub orangina, film twilight, video humour), les réponses vidéos apparaissent en tête des résultats web
Afin d'obtenir plus de réponses vidéos, l'internaute peut ensuite étendre sa recherche au moteur vidéo orange.
Exemple d'une recherche de vidéos
Depuis la page d'accueil Orange.fr, en cherchant "film le petit nicolas" depuis le cartouche de recherche Web, 4 réponses vidéos du film "Le Petit Nicolas" apparaissent en tête des résultats de recherche du moteur orange (après les pubs AdWords...).
- En cliquant sur la vignette vidéo Orange 24/24 Vidéo, l'internaute pourra regarder le film Le Petit Nicolas en VOD
- En cliquant sur le lien Réponses Vidéos, il aura accès à plus de contenus vidéos issus du moteur vidéo orange.
Le filtre "à la télé" permet de restreindre les résultats aux vidéos Le Petit Nicolas qui ont été diffusées à la télévision.
Référencement vidéo sur Orange.fr
Orange est ouvert à tous les partenaires de contenus vidéos officiels mais malheureusement il n'existe pas encore d'interface de soumission publique de sitemaps vidéos ou fichiers mRSS. D'après mes informations ceci devrait voir le jour vers juin 2010.
Orange vs. Google
Bref... Orange complète son offre de recherche mais où sont les fonctionnalités nouvelles par rapport à ce qu'offrent les concurrents (Google avec sa recherche de vidéos ou son site YouTube) ? En voici quelques unes mais suffiront-elles à impressionner les internautes ?
- Orange indexe les vidéos de sources officielles (pas de UGC) plusieurs fois par jour : comparez sur la requête grève : Orange vs. Google : c'est plus pertinent que la "chanson du dimanche" proposée par video.google.fr (que des résultats youtube)
- Orange dispose de l'intégralité des contenus vidéos de l'INA, c'est-à-dire toutes les archives de la télé française.
- Orange simplifie le tri aux internautes par le biais d'options de tri avancé qui restent au second plan. Quelques exemples :
- en choisissant nouveautés, Orange ne garde que les vidéos de moins d'un mois triées par ancienneté, les plus récentes en premier
- en choisissant télé, Orange ne garde que ce qui passe ou est passé à la télé trié par pertinence
- en choisissant publicité, Orange affiche en priorité les pubs les plus populaires (les plus cliquées sur les listes réponses)
Nouveautés de mars 2013
Il n'y a pas que Google dans la vie ! Même si la part de marché d'Orange en France est très faible par rapport à Google, c'est utile de s'y intéresser. D'une part car c'est un moteur 100% français (c'est pas si fréquent) et d'autre part car il faut éviter de dépendre à 100% d'un seul acteur (certains ont pu se rendre compte des risques, par exemple quand Panda frappe un coup, ou Pingouin et autres EMD ou filtres anti-trop-de-pub).
Alors si vous souhaitez réduire votre dépendance à Google, intéressez-vous à Orange, Bing et les autres (Qwant s'il réussit à percer).
Ce qui change
Cette nouvelle version, en place depuis le 7 février 2013, comporte essentiellement les nouveautés suivantes :
Une mise en page des résultats en responsive web design pour accompagner la montée en puissance des recherches sur mobiles et tablettes
Un nouveau design : les résultats en bleu, aérés avec des modules structurés (site officiel, vidéos, actualités, wikipedia, annuaire)
Des réponses plus pertinentes grâce à de nouveaux algos de détection thématique, une base sémantique, et une collaboration avec les sites de la galaxie Orange.
Des fonctionnalités pour accompagner les internautes tout au long de leur recherche : complétion enrichie (autocomplete / suggest), top recherches, suggestions de recherches.
Captures d'écran
Le moteur de recherche d'Orange
L’équipe en charge du développeur du moteur est basée à Sophia Antipolis. Elle a repris la technologie du moteur de recherche Voila pour la faire progresser en termes de pertinence, d’analyse sémantique , d’ergonomie et de rendu graphique.
L'index du moteur Orange comporte environ 6 milliards de documents francophones, des dizaines de millions de triplets RDF (pour leur « graph search » francophone).
Pour enrichir cet index, Orange a établi des partenariats : la presse française en ligne avec ePresse.fr mais aussi avec Wikipédia, Dailymotion, Deezer, 118712, Cityvox ainsi que tout l’écosystème Orange. C'est bien pour compléter le moteur, mais pour l'internaute ça fait parfois trop de la nébuleuse Orange mis en avant...
Concernant Wikipédia, j'ai été surpris de constater que dans les résultats de recherche, le site Wikipédia était remplacé par la version Orange de Wikipédia. C'est la même chose que l'encyclopédie en français, sauf qu'elle contient de la publicité ! J'ai fait la remarque à Orange qui m'a expliqué que c'était une façon de pouvoir financer Wikipédia (une part des revenus publicitaires étant reversée à la fondation Wikimedia).
Conclusion
Orange n'envoie malheureusement pas tant de trafic que ça, mais j'ai pensé que ça valait le coup de faire le point sur les techniques de référencement pour ce moteur français. N'hésitez pas à donner votre avis dans les commentaires ou sur le forum.
Si vous avez des questions, posez-les dans le forum WebRankInfo.
Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.
Depuis plusieurs mois, cela fait bien plus de six fois que j'ai demandé et enregistré le référencement de mon site d'astrologie sidérale, non commercial (la-roulette-cosmique.fr).
Que faut-il faire de plus ?
Merci de votre réponse.
J.P.Besle
merci pour cet article, orange est moins utilisé par rapport d'autres moteurs de recherche pourtant qu'il offre beaucoup de services
Bonsour,
Comme beaucoup, j’associe orange à la téléphonie et au 3G+ et sûrement pas à un moteur de recherche, d'indexation de site ou de référencement. Mais bon, pourquoi pas, peut être qu’avec le temps orange va arriver à s’élargir parmi les mobinautes et pourquoi pas égaler Google .
@Olivier, c'est bien ce que je pensais :-)
Bonjour,
Si je comprends bien, orange envoie moins d'internautes sur nos blogs, car leur moteur de recherche est beaucoup moins utilisé que google?
Les EMD ont encore de beaux jours sur Voila/Orange : je viens de trouver un nom de domaine dont je ne me souvenais même plus l'avoir "en stock !
Cela a été, pour moi, l'occasion de jeter un oeil à une "encyclopédie" intitulée "animO" avec quelques conseils sur les poissons d'aquarium, et là, c'est à se ... dessus de rire tellement il y a des erreurs grossières. Sur 2 pages de ce "guide", j'ai littéralement éclaté de rire devant mon écran. Les auteurs n'ont jamais dû connaître la différence entre un poisson rouge et une carpe Koï par exemple : trop fort (cf. http://www.aquaportail.com/definition-7817-koi.html )
Merci pour cet article qui m'a permis de découvrir que je n'étais pas indéxé chez orange !
Bonjour,
Merci pour l'article. En fait, c'est intelligent de ne pas dépendre uniquement de Google surtout qu'Orange offre des services de qualité. De ma part, je suis satisfaite par la connexion 3G++ qu'elle offre et j'espère que le moteur de recherche Orange soit aussi à la hauteur.
Olivier, ça représente combien en % du traffic de ref nat Orange.fr sur ton site?Merci
@Jeromeweb : très très peu !
Bonjour Olivier
Merci pour l'info. On peut donc comprendre que les méthodes employées sur les autres moteurs sont généralement valables pour Orange et qu'il ne faudrait pas en
déroger surtout pour grappiller quelques positions chez un si faible pourvoyeur de visiteur.