Cet article fait partie des archives de WebRankInfo : certes, il est ancien, mais complet et détaillé pour son époque. Si vous cherchez d'autres informations, faites une recherche sur le site ou participez au forum. Contactez-moi si besoin.
Transcript du chat interview d'Exalead sur WebRankInfo
Le chat organisé le 15/02/2006 à 18h a rencontré un vif succès : environ 50 personnes étaient connectées pour suivre et participer à l'interview de Sébastien Richard, ingénieur chez Exalead.
Voici le compte-rendu :
Interviewer : bonsoir ExaleadGuy :-)
ExaleadGuy : bonsoir à tous
Interviewer : Pouvez-vous présenter, vous et le moteur de recherche Exalead
ExaleadGuy : Tout d'abord je vais présenter la société Exalead et comment elle a été fondée. L'idée est venue à la base à francois Bourdoncle et Patrice Bertin en 1998. à l'epoque ils travaillaient pour Altavista et celui-ci se transformant en portail ne correspondait plus à leur vision de chercheur. Ils ont continué à travailler pour Altavista mais depuis la France dans un labo des Mines de Paris avec déjà l'idée de potentiellement de developper une entreprise sur le sujet. Donc dès le départ les couches profondes d'Exalead ont été développées dans une optique web. En 2000 la société a été créée. Jusqu'en 2004, on avait essentiellement une vitrine technologique comme moteur de recherche centrée sur le web francophone. En 2004 nous avons décidé de passer à la vitesse supérieure et de faire un moteur mondial. Tous les produits Exalead reposent sur la même techno. Juste leur enrobage et leur tuning diffèrent. Les autres produits d'exalead pour rappel sont un moteur de recherche sur pc one:desktop, un moteur de recherche en entreprise one:enterprise et un moteur pour groupe de travail one:workgroup. En ce qui me concerne, je travaille a Exalead depuis 5 ans et je suis le responsable de projet technique de tout ce qui concerne l'aspect Web de notre moteur.
Interviewer : Que pensez vous avoir de plus à proposer que google, yahoo ou encore msn pour pouvoir réussir à concquérir le marché français des moteurs de recherches ?
ExaleadGuy : Par rapport à ces moteurs de recherche nous nous différencions dans le sens où nous voulons proposer une nouvelle méthode de recherche. Ne plus se baser sur du essai erreur, réécriture, visionnage des pages suivantes jusqu'a plus soif. Notre moteur permet de survoler les résultats et à travers les catégories de zoomer dans des détails ou de rebondir sur d'autres concepts. Tout cela s'applique aux résultats du monde entier car la plupart de nos technologies sont plus statistiques que linguistiques et marchent dans d'autres langues. j'invite d'ailleurs ceux qui parlent chinois à tester notre interface chinoise Smile La France est notre marché de départ et nous allons donc consacrer plus d'efforts que sur les marchés au départ en tous cas.
Interviewer : Pouvez vous nous expliquer brièvement l'algorithme de pertinence du moteur, et les facteurs les plus importants permettant d'être correctement placé ?
ExaleadGuy : les facteurs sont globalement les mêmes que dans les autres moteurs et je ne peux que vous faire les mêmes recommandations que les autres moteurs : faites des pages avec du contenu de qualité, proposer une version identique aux internautes et au moteur. ie éviter les pages satellites, les fermes de liens... et devenez la référence dans votre domaine et vous monterez dans les résultats exalead ;-)
Interviewer : On peut constater que la catégorie d'un site indexé dans dmoz est affichée dans les recherches. Quelles sont vos relations avec dmoz ? et quel est le poids donné aux sites y figurant par rapport aux autres ?
ExaleadGuy : nous utilisons principalement dmoz pour sa taxonomie. nous n'avons pas de lien particulier avec cette "association". Etre dans dmoz est un plus mais un très petit plus. nous sommes conscients que bcp d'entre vous êtes en désaccord avec certains choix de ces éditeurs. (la taxonomie c'est l'arborescence des catégories)
Interviewer : Pouvez-vous nous parler de vos projets à venir ?
ExaleadGuy : parmi les projets à court terme nous avons une refonte de notre interface. l'interface actuelle est trop segmentante: des gens qui adorent et des gens qui détestent. nous prévoyons de faire une interface plus légère avec les mêmes options mais plus discrètes afin de remettre les résultats au centre. un moteur de recherche d'image est également prévu. ces deux projets devraient être en ligne en mai au plus tard.
dans le plus long terme le passage à 8 md de pages et de nombreux autres projets dans le cadre de quaero en partenariat avec les autres sociétés impliquées dans les domaines plus multimédia.
illi : Lorsque l'on fait des recherches, on constate que la description de la page correspond plus à son contenu qu'à la balise de description, est-elle est prise en compte ?
ExaleadGuy : les balises meta ont été trop souvent spammées par le passé et leur prise en compte est très faible nous voulons donner. une version qui est la plus proche de ce que les internautes trouveront en allant sur le site. Dans la même optique il y a le thumbnail et la preview.
Julien_ev : Que pensez-vous des balises META (standard comme keywords, ou exotiques comme Dublin Core.)
ExaleadGuy : même réponse que ci dessus le mécanisme part d'une bonne idée mais est trop facilement spammable pour être vraiment pris au sérieux par un moteur
Packref : Quel est le temps de mise à jour des page sur Exalead, n'avez vous pas peur d'être trop lent (comme voila) à prendre en compte les changements ?
ExaleadGuy : la fréquence de mise à jour des pages dépend de nombreux facteurs. toutes les pages ne sont pas rafraichies de la même façon et nous avons développé des algorithmes qui zooment sur les contenus qui ont des chances d'avoir changé. Jusqu'à présent nous étions dans une logique de montée en puissance donc notre vitesse de rafraichissement était encore modérée. mais là nous allons à nouveau nous reconsacrer sur la mise à jour des pages déjà vues. et nous avons les moyens de rivaliser avec les grands moteurs je pense.
hollenfurst : Envisagez vous de mettre en place un système de sitemap ?
ExaleadGuy : c'est à l'étude, nous attendons en partie les retours vis à vis de celui de google. voir si le format choisi n'est pas trop spammable au sens où tous les webmasters mettent "je veux que mon site soit rafraichi toutes les 10s".
oli004 : l'intégration d'une régie publicitaire, phénomène en vogue sur les différents moteurs est-elle envisageable et envisagée sur exalead ?
ExaleadGuy : nous comptons intégrer des liens sponsorisés à court terme mais pas de régie publicitaire en interne au moins au départ
Bill- : Quelle est votre politique concernant le duplicate content ?
ExaleadGuy : nous essayons de les détecter et de n'afficher qu'une version
oli004 : Dans souci de pertinence des résultats donnés par exalead, un système de pénalité visant par exemple à déclasser volontairement un site voire le blacklister est-il adopté ?
ExaleadGuy : nous avons des mécanismes qui essayent de détecter les sites qui essayent d'usurper un ranking. dans ces cas nous ne blacklistons pas (nous trouvons cette méthode un peu trop brutale même si nos amis d'outre atlantique ne partagent pas ce point de vue) nous préférons deranker les sites en question en général
Julien_ev : comment différenciez-vous un annuaire d'une ferme de liens ?
ExaleadGuy : nous avons des algos propriétaires pour cela :-)
ronan : Quel est le comportement de votre robot face aux différentes redirections ( ex redirection 301 )
ExaleadGuy : oui la question a déjà été évoquée sur le forum actuellement nous affichons la "meilleure" version contrairement à nos concurrents qui privilégient toujours la destination. je pense que pour ne pas décontenancer les webmasters. nous allons migrer vers la solution de nos concurrents
Julien_ev : Quelle politique face au contenu caché ? (attributs hidden) qui peuvent être des liens cachés OU des menu dynamiques
ExaleadGuy : nous essayons au maximum de nos capacités d'indexer uniquement le texte qui est visible par l'internaute sur la page.
Pada : Comment aider Exalead à devenir moins "confidentiel" ? (Et est ce un des objectifs premiers pour vous de se retrouver parmi les moteurs les plus connus ?)
ExaleadGuy : vous pouvez parler d'exalead a votre entourage les inciter a l'utiliser ou a postuler pour nos offres d'emplois :-) oui c'est un de nos objectifs d'etre connus. mais pour le moment nous visons plus une approche bouche a oreille et presse avant la campagne publicitaire. Je ne pense pas que malgre son matracage publicitaire msn ait recupere bp d'internautes.
kazhar : D'ou vient le nom "Exalead" ?
ExaleadGuy : Exa veut dire 10 puissance 18 (clin d'oeil a google qui veut 10 puissance 100) nous sommes plus réalistes Smile et lead veut dire guider : nous guidons les utilisateurs vers les bons résultats.
illi : Tenez vous compte du fait que les sites soient valides ou non aux normes W3C ?
ExaleadGuy : ne pas être valide présente le risque de ne pas être interprété correctement par nos robots mais pas de bonus ou de malus spécifique.
oli004 : Existe-t-il sur exalead des commandes spécifiques permettant de voir l'évolution de nos sites web telle que la commande "site:" par exemple
ExaleadGuy : oui site: bien sur et link: qui contrairement à google ne restreint pas la liste des éesultats. en cas de caractères bizarre privilégez les guillemets : site:"exalead.com".
Julien04 : A quoi sert le lien "ajouter mon site" ? par rapport à un simple passage du moteur (grâce à des liens), une inscription manuelle apporte quoi ?
ExaleadGuy : rien de plus çà accélère juste la procédure
Julien_ev : Est il prévu une API exalead ?
ExaleadGuy : nous y réfléchissons mais il nous reste à déterminer les limites payant/gratuit
illi : Existe-t-il un phénomène de SandBox ou de mise à l'épreuve sur Exalead ?
ExaleadGuy : pas vraiment mais c'est toujours dur pour un nouveau site d'occuper les premières places à cause de l'inertie naturelle du web.
kazhar : Quelle est la meilleure méthode à utiliser pour symboliser un espace dans l'url ? un - un _ un + ?
ExaleadGuy : de notre point de vue c'est identique.
xun : Selon vous, quel est le pourcentage d'utilisation de Exalead par rapport aux autres moteurs de recherches ?
ExaleadGuy : nous sommes encore un outsider mais notre traffic a fortement progressé ces derniers mois et je pense que la courbe devrait continuer à monter donc nous devrions bientôt apparaitre dans les baromètres mais actuellement nos clics sont fait à travers du javascript et sont mal comptés
oli004 : Concrètement, exalead en quelques chiffres, c'est quoi ? (combien de serveurs, de pages référencées, etc.)
ExaleadGuy : 50 serveurs et 4 Milliards de pages web
illi : Les liens internes ont ils le même poids que les liens externes ou faites-vous une différence entre les deux ?
ExaleadGuy : chaque lien est traité séparément et nous avons des algos qui les gèrent de la façon la plus appropriée
ronan : Tenez vous compte de la localisation des serveurs , des domaines ( .fr .com) dans le classement ?
ExaleadGuy : peu dans la mesure ou ces infos ne sont pas toujours fiables
ronan : Ou sont situés vos serveurs ?
ExaleadGuy : à Courbevoie dans un grand data center.
kazhar : Comment procédez vous pour les captures d'écran ? à quelle fréquence sont-elles réactualisées ?
ExaleadGuy : la encore la fréquence dépend des pages et nous essayons de rafraichir celles qui changent et qui sont souvent vues pour les construire, nous utilisons des machines qui jouent le role de browsers
mate : pouvez-vous nous donner des infos sur le projet européen de moteur de recherche
ExaleadGuy : pour le moment on est encore dans les phases de réunion et de concertation entre les différents acteurs, donc je n'ai pas bcp d'infos concrètes et je ne suis pas la personne qui gère ce projet à exalead.
ronan : Bonjour , cherchez vous des testeurs ? si oui comment vous contacter ? quel travail attendez vous d'eux ?
ExaleadGuy : nous cherchons surtout des employés pour le moment nous n'avons pas encore mis en place de procédure de recrutement de testeurs de résultats. mais vous pouvez nous remonter ce qui vous apparait bizarre:)
Si vous avez des questions à propos d'Exalead suite à cette interview, posez-les dans le forum Exalead, ExaleadGuy viendra vous répondre !
Un grand merci à l'équipe de modération du chat WRI pour cette organisation.
Interview de François Bourdoncle (avril 2006)
François Bourdoncle, créateur d'Exalead, rappelle qu'ils ont déjà indexé 4 milliards de pages et que les machines nécessaires pour passer à 8 milliards vont bientôt arriver...
D'après lui, la stratégie d'Exalead est d'être le challenger de la nouvelle manière de chercher de l'information dans l'entreprise et sur le web
.
Parmi les (nouvelles) infos, on apprend qu'une nouvelle interface utilisateur est prévue pour l'été 2006. Un ancien d'Amazon travaille dessus...
François Bourdoncle discute également du projet Quaero, un missile à têtes multiples
. Comprenez que Quaero n'existe pas réellement en tant que tel, mais sous la forme de plusieurs applications, dont Exalead mais aussi bientôt Thomson ou France Telecom, sans parler des Allemands.
Référencement vidéo sur Exalead (2008)
Après les fichiers Sitemaps Vidéo de Google, c'est au tour d'Exalead de s'y mettre. Le moteur français a choisi le format Media RSS (mRSS) déjà adopté par Yahoo. Explications...
Comme expliqué sur le blog d'Exalead, c'est très simple de faire indexer des vidéos dans leur moteur de recherche : il suffit de mettre en place des flux RSS multimédia au format mRSS.
Voici l'exemple fourni :
<?xml version="1.0″ encoding="utf-8″?> <rss version="2.0″ xmlns:media="http://search.yahoo.com/mrss/"> <channel> <title>Mon site</title> <link>http://www.monsite.com/rss/mrss.xml</link> <description>Vidéos publiées sur mon site</description> <item> <author>jean56</author> <title>Interview de Pierre</title> <link>http://www.monsite.com/video/1</link> <description>Pierre répond à mes questions au sujet de la sortie d'un nouveau produit</description> <guid isPermaLink="true">http://www.monsite.com/video/1</guid> <pubDate>Mon, 25 Nov 2007 08:42:00 +0000</pubDate> <media:content url="http://www.monsite.com/player/1/interview_de_pierre.swf" type="application/x-shockwave-flash"/> <media:content duration="325″> <media:thumbnail url="http://www.monsite.com/vimages/1.jpg" width="340″ height="250″ /> <media:keywords>Pierre, interview, nouveauté</media:keywords> <media:rating scheme="urn:simple">nonadult</media:rating> <media:category>Entertainment</media:category> </item> </channel> </rss>
N'oubliez pas d'aider les moteurs de recherche à trouver vos flux en les indiquant dans l'entête de vos pages à l'aide d'une balise <link>, par exemple pour mon flux RSS classique :
<link rel="alternate" type="application/rss+xml" title="Actualité WebRankInfo : référencement et moteurs de recherche" href="https://www.webrankinfo.com/rss.php" />
Pour l'instant la plupart des vidéos indexées par Exalead proviennent de Dailymotion, YouTube ou Metacafe. Je trouve dommage pour ma part qu'on ne puisse pas filtrer par langue (en tout cas je n'ai pas trouvé...). Par exemple pour ipod on ne trouve que des résultats anglais :
Si vous avez des questions, posez-les dans le forum WebRankInfo.
Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.