Wikia est sortie en version Alpha

  • Auteur de la discussion Auteur de la discussion Misix
  • Date de début Date de début
WRInaute discret
Wikia : voici le moteur vers lequel pas mal de regards sont tournés en ce début d’année 2008, en tout cas dans le monde des référenceurs et des webmasters. En effet, c’est le moteur open source lancé par le fondateur de Wikipedia, Jimmy Wales. Voici quelques premières impressions…

avis d'Olivier Duffez :

Présentation de Wikia
Wikia est un projet de moteur de recherche Open Source qui mettra à contribution les internautes pour assurer une bonne pertinence. Ce n’est sans doute pas vraiment une surprise de savoir qu’à la tête de Wikia on trouve Jimmy Wales, celui-là même qui a créé Wikipedia avec le succès qu’on connait. Parmi les autres investisseurs, on trouve Bessemer Venture Partners (en mars 2006) et Amazon (en décembre 2006).

Wikia est basé sur le logiciel Open Source Nutch et utilise Grub pour bâtir son index. Annoncé en janvier 2007, Wikia est disponible en version alpha (même pas encore beta !) sur alpha.search.wikia.com/.

wikia-search-alpha.jpg

Premières impressions sur Wikia
A ce que j’ai pu lire un peu partout, l’accueil n’est pas excellent : d’une part l’index n’est pas encore assez étoffé (on parle d’environ 100 millions de pages web contre 20 à 30 milliards pour Google d’après ce que j’imagine), d’autre part la pertinence n’est que rarement au rendez-vous. Certains comme Michael Arrington descendent littéralement la sortie de Wikia, tandis que Jimmy Wales en personne se défend en expliquant qu’il ne s’agit que d’une première version, qu’il faut lui faire confiance – après tout, au lancement de Wikipedia, il n’y avait pas d’encyclopédie mais plutôt un site assez vide !

Malgré tout, j’ai apprécié qu’il soit déjà utilisable pour des français. Bon d’accord, les accents sont mal gérés (c’est le moins qu’on puisse dire), mais on voit que les résultats sont adaptés en fonction de la langue de l’internaute (une recherche sur ipod renvoie principalement des résultats français).

Je n’ai jamais regardé comment fonctionne Nutch, donc j’espère que certains donneront des explications dans les commentaires ou le forum. Curieux, je me suis forcément intéressé au score affiché à côté de chaque résultat.

La formule du ranking basée sur Nutch
En cliquant sur le score à côté d’un résultat, on obtient des informations pas spécialement destinées à Monsieur Tout le monde, voici un exemple avec la requête ipod :

page

score for query: ipod

  • 16.0177 = (MATCH) sum of:
    • 6.1698627 = (MATCH) weight(url:ipod^4.0 in 183946), product of:
      • + 0.7324864 = queryWeight(url:ipod^4.0), product of:
        • 4.0 = boost
        • 11.230903 = idf(docFreq=36)
        • 0.016305154 = queryNorm
      • + 8.423177 = (MATCH) fieldWeight(url:ipod in 183946), product of:
        • 1.0 = tf(termFreq(url:ipod)=1)
        • 11.230903 = idf(docFreq=36)
        • 0.75 = fieldNorm(field=url, doc=183946)
    • 0.8805822 = (MATCH) weight(content:ipod in 183946), product of:
      • + 0.09852816 = queryWeight(content:ipod), product of:
        • 6.042762 = idf(docFreq=6627)
        • 0.016305154 = queryNorm
      • + 8.937366 = (MATCH) fieldWeight(content:ipod in 183946), product of:
        • 5.91608 = tf(termFreq(content:ipod)=35)
        • 6.042762 = idf(docFreq=6627)
        • 0.25 = fieldNorm(field=content, doc=183946)
    • 8.967256 = (MATCH) weight(title:ipod^1.5 in 183946), product of:
      • + 0.23415738 = queryWeight(title:ipod^1.5), product of:
        • 1.5 = boost
        • 9.573962 = idf(docFreq=193)
        • 0.016305154 = queryNorm
      • + 38.29585 = (MATCH) fieldWeight(title:ipod in 183946), product of:
        • 1.0 = tf(termFreq(title:ipod)=1)
        • 9.573962 = idf(docFreq=193)
        • 4.0 = fieldNorm(field=title, doc=183946)
En 1ère approximation, on peut dire que l’algorithme de Wikia analyse l’URL, le titre et le corps de chaque page et calcule pour ces zones, un indice de densité selon la technique TF*IDF normalisé et parfois pondéré par un facteur appelé boost. Dans cet exemple, on voit que le corps de la page n’apporte quasiment aucun point de pertinence, l’essentiel venant de l’URL et du titre. J’espère que le véritable algorithme est plus évolué que ça, sinon les humains qui doivent améliorer les résultats de Wikia vont avoir beaucoup de boulot…

Les notations des internautes
Pour l’instant, les internautes peuvent noter chaque résultat en cliquant sur des étoiles pour donner une note entre 1 et 5. Comment Wikia Search gèrera les inévitables abus d’un tel système ? On peut se poser la question…

Les internautes peuvent également contribuer en rédigeant des mini-articles, qui sont en partie affichés tout en haut des résultats. On est déjà habitués avec les pages de Wikipedia qui sortent dans Google ;-)

Pour le reste de l’intervention humaine, ça se limite à la création de profils pour afficher des photos de personnes en rapport avec la requête. De là à estimer que Wikia Search n’est qu’un réseau social de plus, il n’y a qu’un pas que certains ont déjà franchi d’après ce que j’ai pu lire sur des blogs.

En conclusion, il est encore beaucoup trop tôt pour juger le moteur de recherche Wikia, car l’index est trop petit, et surtout les apports des internautes sont encore inexistants ou presque.
 
WRInaute passionné
Je viens de faire quelques tests avec des requêtes concurrentielles que je connais parfaitement, et bien c'est pas brillant... des vilains sites spameur (milliers de pages cachées, etc.) en bonnes places, on se croirait sur Voila !

C'est du Beta, mais quand même !?
 
WRInaute discret
Oui mais le site a ouvert aujourd'hui, arriver a du voila en directement c'est déja bien :)

(Voila a mis des année a en arriver la)

Et surtout le site ne comptabilise pas encore les votes, la pertinence sera jugée quand ça sera pris en compte dans l'algo.
 
WRInaute passionné
Euh, la je crois ne rien comprendre. J'ai testé plusieurs requête de "base" et il ne trouve rien... :roll:
 
WRInaute accro
Wikia est disponible au jour dit, c'est un premier point positif.
Il répertorie sans broncher une bonne partie de mes requêtes-tests mais sans filtre de zone ça ne permet pas de retrouver ses positions habituelles :)
Je dirais que je suis heureusement surprise par les résultats globaux. Attendons les filtres.
 
WRInaute passionné
Misix a dit:
Oui mais le site a ouvert aujourd'hui, arriver a du voila en directement c'est déja bien :)

(Voila a mis des année a en arriver la)

Et surtout le site ne comptabilise pas encore les votes, la pertinence sera jugée quand ça sera pris en compte dans l'algo.

Exact ! J'ai été dure sur ce coup :oops:
 
WRInaute passionné
Mon conseil : Testez-le tous aujourd'hui, quoi que vous en pensez !

Mais pourquoi j'dis ça moi ?
Ha vi car on ne sait jamais, ça pourrait être "valorisant" de raconter à nos futurs petits enfants qu'on a testé wikia search le jour même de son lancement... "Waw papy, t'es ultra vieux mais t'en a vécu de belles choses" :lol:

HS @ Misix : ben non finalement je ne me suis pas encore couché ;)
 
WRInaute discret
1199700921_wikia-rank.png


J'ai aussi remarquer que chaque site à une sorte de note, j'ai pas réussit à comprendre exactement la signification mais au premier coup d'oeil ça semble être une note comme pourrait être le PageRank...

HS@Bertimus Je me disait bien :)
 
WRInaute passionné
En fait avec FF et Mac, les résultats ne s'affiché pas. Mais avec Safari, j'ai aucun problème...
Je ne comprend pas trop les notes des sites. Sur des requêtes simple, des sites "bidon" sont devant les miens. Pour l'instant, je trouve leurs classement complétement Hs.
 
WRInaute passionné
Allons nous avoir le droit à quelque dossier sur wri pour aidé au référencement de nos site sur wikia ?
 
WRInaute discret
Donc si j'ai bien compris, les internautes vont pouvoir noter les sites ce qui va aider au positionnement...

Mais quand on sait que les internautes cliquent majoritairement sur les 3 premiers résultats, le site en 15 ème page (qui est peut-être très bien) n'a aucune chance d'être noté et seuls ces premiers sites vont "s'affronter" à armes égales.

Les webmasters vont encore devoir "trafiquer" pour faire monter leur site en première page..., ce qui ne change pas grand chose au fonctionnement actuel.

J'attends de voir...
 
WRInaute impliqué
Sur ma requête favorite, je truste les 10 premières places avec des sous domaines :lol:

Je n'ai jamais créé de sous domaines dans ce but mais pourquoi pas.

Loïc
 
WRInaute passionné
Comme Exalead, il trust les sites avec le mot clef dans le nom de domaine.

5e sous Google, absent des 100er résultats sur Wikia parce que je n'ai pas ce mot clef dans le domaine.

C'est flagrant.

De même qu'il a du mal à faire la relation entre singulier / pluriel.
 
WRInaute impliqué
OLALALA !!

Grave ! pour mon mot-clé il sort des sites qui ne sont plus entretenus et même en vente devant moi... beurk!
 
WRInaute discret
Dorian53 : je confirme. Je ne suis placé sur aucune de mes requête favorites, par contre j'apparais en première page sur la requête du mot-clé présent dans mon nom de domaine (alors que je n'y suis ni dans Google, ni dans Yahoo).
 
WRInaute occasionnel
Première impression, vraiment pas aml. Les résultats sont rapides et assez pertinents.
Avez vous remarqué aussi, "il n'y a pas d'article encore pour 'keyword', soyez le premier à le rédigier".
Ca ressemble au novueau service de google knob...

Vraiment pas mal même si c'est pas encore suffisant pour quitter google.
 
WRInaute discret
Bonjour,

Je l'ai testé dans tous les sens... Je ne comprends pas vraiment de quelle manière il trie les sites, mais à défaut d'une pertinence parfaite, je reconnais que le début est prometteur. Reste les notes, le "wikia rank" donné aux site se base sur quel critères autre que les votes?

en tout cas, j'ai testé sur certains de mes sites, je possède un assez bon classement, certes moins bon que google sur mes mots clés.

Je le trouve plus sympa que le moteur de vo*la et de y*hoo pour ma part.
 
WRInaute passionné
Mes petits reproches sur la forme...

Je trouve dommage que les résultats ne représentent environ qu'1/3 de la largeur de mon écran (j'ai un 19" wide).
Quand je vais au-delà des 3 premiers résultats, 2 tiers de mon écran restent ainsi vides et ce n'est pas très sexy.

Hum, sinon, je n'aime pas non plus la présentation des résultats suivants (au dessous comme sur voilà), je trouve plus ergonomique le bon vieux système de pagination adopté par google, live, exalead, yahoo, categorizator, phpld et freeglobes :mrgreen:
 
WRInaute discret
:? mince suis pas dans l'index. Y a t'il un bot qui est passé chez vous?
Sinon ça m'a l'air prometteur en tout cas c'est bien rapide et l'interface est agréable.

Par contre, moi aussi, je ne supporte pas la façon d'accéder aux résultats suivants.
 
WRInaute passionné
Résultats encore en mode alpha :)

Bizarre : Pas de résultat Wikipédia !!

Innovateur : Pagination marrante.. utile pour encourager les chercheur à aller en profondeur...

Défaut : Je rejoins bertimus pour la largeur, chez moi (1280x800) plus que la moitié est vide !!


Verdict : Pas mal pour une alpha.. très prometteur je pense..
 
WRInaute passionné
acamar a dit:
Résultats encore en mode alpha :)

Bizarre : Pas de résultat Wikipédia !!

Innovateur : Pagination marrante.. utile pour encourager les chercheur à aller en profondeur...

Défaut : Je rejoins bertimus pour la largeur, chez moi (1280x800) plus que la moitié est vide !!


Verdict : Pas mal pour une alpha.. très prometteur je pense..

Perso j'aime pas du tout la pagination, bien qu'elle soit originale.
 
WRInaute passionné
-> Defaut :
- La pagination, j'aime vraiment pas le système. (et puis, vous affichez comment la 10ème page facilement ? Vous cliquez 10 fois sur suivant ?)
- Pourquoi avoir serré les résultats à gauche, alors qu'il y a rien à coté ?
- J'ai eu un coup de lag en faisant "suivant" (gèle de FF) pourtant j'ai pas un mauvais PC et il y avait rien d'ouvert.

-> "Qualité"
- Pour une version Alpha (donc sans donnée historique à analyser, en dehors des pages en elle-meme) les résultats ne sont pas si spammé que ça. Donc si leur système de classement par les utilisateurs est efficace, ça pourrait être un concurrent de Google (sur le loooonnng terme).

-> Ce qui va bloquer le projet
- Comme tout le monde, j'ai peur que leur système soit un peu floodé par des webmasters qui tricheront (et il y en aura énormement)
- Le service est commercial, contrairement à Wikipedia, alors est-ce que les fans de wikipedia voudront suivre ? C'est pas encore gagné.
 
WRInaute accro
tonguide a dit:
- Le service est commercial, contrairement à Wikipedia, alors est-ce que les fans de wikipedia voudront suivre ? C'est pas encore gagné.
Un service commercial sur lequel je peux intervenir, c'est encore plus excitant !
Je signe des deux mains :)
 
WRInaute occasionnel
:)

je trouve les résultats corrects pour une alpha.
Un peu spamé, car on dirait qu'il donne beaucoup plus d'importance à la densité du keyword qu'au backlink, mais ça reste prometteur.
 
WRInaute passionné
tonguide a dit:
-> Defaut :
- La pagination, j'aime vraiment pas le système. (et puis, vous affichez comment la 10ème page facilement ? Vous cliquez 10 fois sur suivant ?)
Aller directement en page 10 c'est seulement une habitude de webmasters, Wikia devrait cibler plus l'utilisateur lambda.. je pense que ce système pourrait révolutionner la recherche, en dissuadant les utilisateur de s'arrêter en 2eme ou en 3eme page et du coup casse un peu le "monopole" des sites bien classé en top10 pas toujours pertinemment !
 
WRInaute passionné
J'ai fais plusieurs essais.

Je trouve des résultats proches de ceux de Google.

Mes sites en fait sont plus avantagés. Prime au contenu encyclopédique?

Les descriptions (snippets) sont différents.
 
WRInaute discret
Résultats très mauvais pour ma part, sur des requetes de >1M sur google, le top 3 c'est des pages perso ou le compteur indique 351 visiteurs depuis la création en 2003 o_O

Ensuite, outre les problèmes d'encodages, les requêtes accentuées ne retournent rien, aucun résultat... ?

Enfin, étonné de ne trouver aucun résultat de wikipédia, je retourne compléter des articles qui eux sortent correctement sur Google :)
 
WRInaute discret
Bon y a encore du boulot. Par exemple si l'on prend comme requête ww2 (acronyme de world war 2) et bien google comprends qu'il s'agit de cela et retoure plus de 20 millions de résultats, sur wikia on ne se retrouve qu'avec des résultats ou ww2 apparaît dans l'URL.

En plus le support des accents est absent (aussi valable sur la présentation), et détail amusant on a droit à votre recherche retourne 11 résultats, mais il nous dit plus bas affichez les résutat 7-16. Résultat si on clique la dessus on a droit à plein de boites vertes avec écrit 7-16...

Bon une fois que tous ces bugs auront été corrigé, il faudra voir. Par contre pour la pagination cela ressemble pas mal à du Google chez moi.

Y a t'il un bot pour wikia?
 
WRInaute discret
greatpatton a dit:
Bon y a encore du boulot. Par exemple si l'on prend comme requête ww2 (acronyme de world war 2) et bien google comprends qu'il s'agit de cela et retoure plus de 20 millions de résultats, sur wikia on ne se retrouve qu'avec des résultats ou ww2 apparaît dans l'URL.

Les acronymes, ça viendra avec le temps, ce n'est qu'une version alpha.
 
WRInaute discret
tofm2 a dit:
c'est la question que tout le monde se pose, ainsi que de savoir où soumettre l'URL de son site.

A bon c'est encore utile de soumettre une URL à un moteur ? :lol:

Sinon pour un début il est pas trop mal ce moteur ! ( il est déjà bcp mieux que megaglobe par exemple )
 
WRInaute discret
Bon arretez de tester tous vos mots clés, les serveurs ont sauté. Inacessible depuis chez moi.

EDIT : ha ben non c'est revenu
 
WRInaute discret
Alors je pense que vous êtes un peu dur pour plusieur raisons.

Certe les résultats sont pas trés pertinent mais déja le site est optimiser pour le web anglais.

Un exemple, j'ai optimiser le site Pleax.com sur "Galerie Photos".

Sur google English mon site est dernier de la première page, et regarder sur wikia? hoo magique, la même chose :)

Pourtant contrairement a ce que beaucoup ont dit, il ne se base pas que sur le "domaine" sachant que sur Pleax il n'y a ni galerie, ni photos.

Enfin voila le service vient d'ouvrir et je rappel que le but est que les résultats soit réaliser en fonction des internaute et que la, le service vient tout juste d'ouvrir.

Patience, attendez au moins la comptabilisation des votes et éventuelement une version française pour vous faire un réel avis.

La version alpha c'est juste pour montrer le principe.
 
WRInaute accro
Misix a dit:
Alors je pense que vous êtes un peu dur pour plusieur raisons.

Certe les résultats sont pas trés pertinent mais déja le site est optimiser pour le web anglais.

Un exemple, j'ai optimiser le site Pleax.com sur "Galerie Photos".

Sur google English mon site est dernier de la première page, et regarder sur wikia? hoo magique, la même chose :)

Pourtant contrairement a ce que beaucoup ont dit, il ne se base pas que sur le "domaine" sachant que sur Pleax il n'y a ni galerie, ni photos.

Enfin voila le service vient d'ouvrir et je rappel que le but est que les résultats soit réaliser en fonction des internaute et que la, le service vient tout juste d'ouvrir.

Patience, attendez au moins la comptabilisation des votes et éventuelement une version française pour vous faire un réel avis.

La version alpha c'est juste pour montrer le principe.
Tout le monde a bien compris qu'il s'agit d'une Alpha et que le son de son moteur est prometteur. Je pense qu'il ne faudra pas attendre un an pour voir s'améliorer le système.

Contrairement à ce que tu sembles croire, les WRInautes ne se sont pas montrés durs : même, ce sujet pourtant polémique a été traité avec une rare objectivité (mises à part les rares exceptions qui valident l'ensemble).
C'est tout bon et il faut que plus de webmasters opèrent des tests.
Pour ma part, j'ai passé la journée à photographier un demi-millier de requêtes et je compte bien en suivre l'évolution.
 
WRInaute passionné
Des résultats basé en très grande partie du faite que le ndd contient la requête.

J'ai vu ça récemment ailleurs ...
 
WRInaute accro
en tant qu'internaute, je trouve le système de changement de page très peu pratique, et encore, je suis habitué, alors un newbie :cry:
le seul changement de page que je trouve très ergonomique est celui de Live image : on voir que le curseur s'est modifié et que l'on peut donc continuer à descendre.
Là, la page s'agrandit, sans qu'on s'en aperçoive, car on est habitué avec tous les moteurs (sauf voilà, mais bon...)

Maintenant, en tant que webmaster, je trouve cela encore plus nul, car je ne récupère aucun keyword dans le referer
 
WRInaute accro
Leonick a dit:
en tant qu'internaute, je trouve le système de changement de page très peu pratique, et encore, je suis habitué, alors un newbie :cry:
(...)
Maintenant, en tant que webmaster, je trouve cela encore plus nul, car je ne récupère aucun keyword dans le referer
En tant qu'internaute et en tant que webmaster, ok, on a ton opinion, cool et très bien.
Mais en tant que Leonick, le pionnier curieux de tout et qui en a vu d'autres, mmh ? Mmmmh ? :)
 
WRInaute discret
Comme je les signaler sur un poste antérieure, je trouve qu'il se base pas mal sur google (version anglais).
 
WRInaute accro
Koxin-L a dit:
Des résultats basé en très grande partie du faite que le ndd contient la requête.
J'ai vu ça récemment ailleurs ...
Wikia me fait beaucoup plus penser à Yahoo! qu'à Google pour ma part.
Avez-vous fait la comparaison ?

Il faut noter deux choses, c'est une version alpha et l'index est jeune.
Il va (logiquement) devenir de plus en plus pertinent via les votes et les clics, c'est toujours plus ou moins comme ça que ça fonctionne.

Pour ma part je pense que ce système de vote va être très favorable aux résultats. Certes les webmasters vont se mettre des bonnes notes mais plusieurs milliers d'Internaute pourront mettre une autre note derrière.

Comme je l'ai dit sur mon WWW, c'est tout à fait dans l'air du temps, social au possible. C'est du search 2.0, d'ailleurs BigG a fait quelques essais là dessus cet été sur son index US...
 
WRInaute passionné
intéressant le bug :

recherche http://re.search.wikia.com/search#ferra ... e%20france

résultats 11 à 20 :

REFERENCEMENT & VISIBILITE INTERNET - SOCIETE DE REFERENCEMENT
... Location canoe kayak | Location quad ile de france | Produits entretien ecologique | Restaurant fruits ... agence immobiliere pyla location canoe ile de ...
http://www.referen-------------.. - Cached - 1.48
Annuaire Internet Lyon: Création sites internet Lyon, refonte de site, actualisation site internet,
... d occasion | Location canoe kayak ile de france | Location canoe kayak seine et ... Location canoe kayak | Location quad ile de ...
http://www.intern-------- - Cached - 1.86
REFERENCEMENT INTERNET - E VISIBILITE - REFERENCEMENT SITE INTERNET
... d occasion | Location canoe kayak ile de france | Location canoe kayak seine et ... Location canoe kayak | Location quad ile de ...
http://www.e-visi---------- - Cached - 3.16
Location moto : Quelques adresses de loueurs moto en France
... une moto en France Loueurs de motos ayant des agences dans ... événements mariages et autres ( tour de France ...
http://www.motoserv--------- - Cached - 0.66
Locations de véhicules
... plus de 30% du prix de la location , 50% de votre temps de transport et 50% de vos frais de carburant ...
http://vaca-------------------.. - Cached - 1.14
Société de référencement : Internet Rentable
... d occasion | Location canoe kayak ile de france | Location canoe kayak seine et ... Location canoe kayak | Location quad ile de ...
http://www----------/ - Cached - 1.26
 
WRInaute discret
C'est un bon début :D
C'est vrai qu'on va voir des sites inconnus ou disparus. C'est instructif ce coté "Exploration de la forêt vierge" :lol:
Par contre, on remarque un GROS défaut : Wikia a du mal a indexer les pages internes ou privilégie trop les "Home pages" :cry:
 
WRInaute accro
C'est normal, il faut d'abord construire un index ensuite explorer.
C'est très classique, il faut lui donner du temps.
Comme je l'avais dit avec Megaglobe, on indexe pas le web en quelques mois...
 
WRInaute passionné
Et on n'arrive pas à plusieurs dizaines de milliers de visiteurs quotidiens en quelques mois non plus ;) [Seul seuil pour que les votes soient pertinents]
 
Nouveau WRInaute
Ce qui est étonnant vu cette url :
http://search.isc.swlabs.org/explain.js ... ng%20kon...

C'est le nutch en haut
http://lucene.apache.org/nutch/docs/fr/

Nutch est un framework open source basé sur lucene (Développé en Java par la fondation apache) et qui permet de faire de la recherche full text.

Ils se seraient donc basé sur un outil existant. Nutch a été créé en 2004 :
http://lucene.apache.org/nutch/

Hadoop est utilisé dans nutch et permet de gérer de très grandes quantités d'infos :
http://lucene.apache.org/hadoop/

Ils en parlent d'ailleurs sur leur site ici :
http://search.wikia.com/wiki/Nutch

On voit d'ailleurs que c'est effectivement fait en java :
http://alpha.search.wikia.com/dsfdf

description The requested resource (/dsfdf) is not available.
Apache Tomcat/6.0.14

Wikia n'a donc rien de révolutionnaire, il utilise simplement un outil open source disponible à tous. Maintenant, peut être qu'ils y ont ajouté leur touche...

A suivre...
 
WRInaute discret
Alors j'ai quelques info sur Wikia, déja il index bien lui même les pages via une technologie racheter : Grub

Aussi, il y a 100 000 000 de pages indéxer aujourd'hui. Donc il ne se base pas sur les autres moteur comme ont aurait pu le penser.
 
WRInaute accro
le vote des internautes, je n'y crois pas trop. Vous êtes déjà revenu sur un annuaire pour noter un site trouvé sur l'annuaire ?
alors l'internaute moyen ne le fera pas.
Je vois bien émerger des offres "5000 votes 4,5 de moyenne pour 100 €" avec des rangées de sri lankais qui seront devant leur ordinateur à travailler pour vous faire avoir vos votes "4,5" sur 5. Parce que uniquement des votes 5 ça ferait trop bizarre.
Sinon, quand vous faites des recherches sur google et que les premières pages sont remplies de résultats de m... de sites spammeurs, utilisez-vous le formulaire de spamreport ou bien vous dites-vous "fait ch... ces sites, allons voir page suivante" ? là, je parle quand ce ne sont pas vos propres requêtes, bien entendu.
Alors pourquoi le feriez-vous pour un vote sur un nouveau moteur ?
Ensuite, il semblerait que le moteur soit basé sur nutch (c'est le logo que l'on a quand on clique sur le coefficient de boost d'un des résultats), donc l'algorithme sera connu de tous, pour ne pas qu'il y ait de triche (sous entendu les autres trichent...), ça permettra donc aux spammeurs de jouer avec leur contenu histoire d'avoir un coefficient de boost le plus haut possible.
C'est juste une résolution de systèmes d'équations à plusieurs inconnues. :evil:
 
WRInaute accro
Leonick a dit:
alors l'internaute moyen ne le fera pas.
Je crois au contraire qu'il ne gênera pas pour mettre un 0 à un site qui l'embête...
J'imagine que c'est un "détail" dans l'algorithme comme le PR de Google...
Mais ça doit jouer, ça c'est sur.
Et le coup de la vente de vote je n'y crois mais alors absolument pas !
D'une part ça sera trop grillé ensuite je reste persuadé que ça ne changera le classement aussi facilement que ça.
 
WRInaute accro
Szarah a dit:
Mais en tant que Leonick, le pionnier curieux de tout et qui en a vu d'autres, mmh ? Mmmmh ? :)
A la demande de Szarah je vais faire mon ch...
je fais une recherche, j'arrive à me persuader que leur passage entre chaque page est super cool :), la preuve, je vais jusqu'à la 10° page, c'est dire.
Bon, le site sur lequel j'ai été est vraiment pas top, je fais donc retour arrière pour revenir sur Wikia là d'où je viens, normal quoi comme sur tous les moteurs.
Et là, mieux que Mr propre, Ajax a tellement nettoyé mes traces que wikia ne se rappelle même pas que j'étais en page 10 et me ramène sur la 1° page.
Donc plutôt que de refaire défiler mes 9 pages suivantes pour dire "le site là, il est pas top", je retourne sur mon moteur de recherche habituel. Bye bye :evil: :lol:
En plus, la version en cache ajoute avant mon contenu un content-type UTF-8 et donc tous mes caractères accentués prévus pour ISO-8859-1 se transforment en ? :cry:
PS : pour ceux qui le souhaitent, voici le USER_AGENT
Grub/2.0 (Grub.org crawler; http://www.grub.org/; bot@grub.org)
 
WRInaute accro
Misix a dit:
Alors j'ai quelques info sur Wikia, déja il index bien lui même les pages via une technologie racheter : Grub

Aussi, il y a 100 000 000 de pages indéxer aujourd'hui. Donc il ne se base pas sur les autres moteur comme ont aurait pu le penser.

De mémoire, ils devaient utiliser Nutch aussi.
Probablement Grub pour le crawl réparti, et Nutch pour l'indexation et la recherche.
 
Nouveau WRInaute
Bonsoir,

Quelqu'un a t-il réussi à indexer son site manuellement ou faut-il attendre que ce soit fait automatiquement?

Car mon site n'est pas indexé :(
 
WRInaute passionné
Je ne pense pas que l'internaute utilisera le système de vote.
S'il trouve un bon site correspondant à sa recherche, il ne va pas s'amuser à faire un "page précédente" pour voter.
Seul les méchants webmasters :D voteront contre leurs concurrents.
 
WRInaute impliqué
Pas convaincu mais bon c'est alpha.

Un bug sur cette recherche : http://re.search.wikia.com/search#petit ... 20belgique (voir les résultats suivants), de plus PF.be n'est pas indexé sur son nom.

Problèmes de charset avec les recherches et caractères accentués

Septique quand même, curieux de voir la suite

Au fait, une idée des termes pour les recherches spéciales (site: , link: , ...) ?
 
WRInaute discret
perso, les requêtes donnent n'importe quoi et les résultats ne sont même pas triés sur leur score "boost" ... problème d'accent avec safari... j'vais attendre l'alpha de l'alpha avant de repasser

>Leonick ,au début, j'ai même pas trouvé le bouton "suivant" :D , l'ajax donne une fiche plus complète des résultats (on peut comparer facilement) et sur safari de retour arrière est possible... 8)
 
WRInaute passionné
Szarah a dit:
Jeviensderio a dit:
greatpatton a dit:
Y a t'il un bot pour wikia?

Pas besoin, il reprend les résultats des autres moteurs! :)
Bin ? Tu tiens ça de où ? Il est vrai que personne n'a signalé avoir vu passer de bot Wikia mais je n'ai pas lu qu'il jouait au métamoteur. J'aurais raté un troll ?

Pour avoir des résultats pertinent sur n'importe quel sujet, proches des résultats de Google ou Yahoo, il faut une base de données immense.

Ce n'est pas en quelque mois qu'il peut atteindre les 10-20 milliards d'URL, des autres moteurs, donc il a du reprendre leurs bases.
 
WRInaute occasionnel
:P Bonjour a tous, j'ai aussi des résultats pas français du moins pour certaines des requetes. il faut voir la suite c'est le lancement donc j'arrive a comprendre qu'il a des choses a faire. wiki va donner quelques visiteurs en plus, bien c'est toujours bienvenue chez moi :). bonne journée a tous et a toutes a bientôt

:arrow: :oops:
 
WRInaute accro
Pour un Alpha, je suis impressionné

kmenslow a dit:
Je ne pense pas que l'internaute utilisera le système de vote.
S'il trouve un bon site correspondant à sa recherche, il ne va pas s'amuser à faire un "page précédente" pour voter.
Seul les méchants webmasters :D voteront contre leurs concurrents.

Pas d'accord, au contraire l'intéret meme d'un nouveau moteur qui pourrait exploser serait d'etre participatif (en version 2.0) et de demander l'avis des utilisateurs pour virer des sites spams (y en a de plus en plus dans nos boites aux lettres pourquoi ne pas les enlever des moteurs nous meme)


dorian53 a dit:
Vous croyez que chez Google ils ont rigolé avec cette version Alpha ?

Meme si ce n'est pas du tout 'ready', ça n'a rien de drole pour Google,
je trouve que c'est meme mieux que LiveSearch
(contre qui j'ai les dents en ce moment :( )

- Trop de réponses "mondiale" à mon gout genre site .cn
et autres extensions dont meme certaine que je ne connaissais pas.
- Le syteme pour augmenter le nombre de résultats est peu pratique.
- C'est visuellement très triste.
 
WRInaute passionné
Misix a dit:
Alors j'ai quelques info sur Wikia, déja il index bien lui même les pages via une technologie racheter : Grub

Aussi, il y a 100 000 000 de pages indéxer aujourd'hui. Donc il ne se base pas sur les autres moteur comme ont aurait pu le penser.


Wikia a racheté le moteur Grub à Looksmart il y a quelques mois. Possible que ce dernier intégre nutch en tant que librairie.

Même s'il n'y a que 100 millions de pages indexées, c'est impossible à obtenir sans reprendre les bases de données d'autres moteurs, cela avec des opérateurs humains, en quelques mois de surcroit.
 
WRInaute impliqué
dorian53 a dit:
Comme Exalead, il trust les sites avec le mot clef dans le nom de domaine.

5e sous Google, absent des 100er résultats sur Wikia parce que je n'ai pas ce mot clef dans le domaine.

C'est flagrant.

De même qu'il a du mal à faire la relation entre singulier / pluriel.

Oui et ça je n'aime pas non plus! :(
 
WRInaute impliqué
OK pour grub. Qui a eu des visites de Grub? :)

Je suis en page 46 sur le mot-clé peintre par exemple et en page deux sur Google! Je n'ai pas essayé les autres mots clés. ça ne s'annonce pas très bien si c'est la densité des mots clés qui compte le plus car on ne va pas truffer un site de texte bidons pour le plaisir. Je me fichait de Live, Yahoo et autre Voilà,
mais là c'est différent car cela va sans doute compter. Alors :twisted:
Comment se référencer correctement sur Wikia ?
 
WRInaute passionné
Pertinence 0, sur plus de 100 requêtes que je suis.
C'est pas parce que le moteur a certaines "garanties" qu'il faut se complaire dans du "c'est une alpha", "on indexe pas le web en quinze jours".

Heureusement que c'est une alpha dirais-je, parce que là, pour moi, il n'y a rien. Nada, Creux.

Il va falloir mettre les wikinautes au travail....
 
WRInaute passionné
WebRankInfo a dit:
quelqu'un sait comment on peut identifier les robots utilisés par Wikia (Grub ?) ?

j'ai détecté ça récemment :
NutchCVS/0.7.2 (Nutch; http://lucene.apache.org/nutch/bot.html; west@cis.poly.edu)

alors après, ya différents user agent "nutch" :
  • * Balihoo/Nutch-1.0-dev (Crawler for Balihoo.com search engine - obeys robots.txt and robots meta tags ; http://balihoo.com/index.aspx; robot at balihoo dot com)
 
WRInaute accro
Rien à dire de plus, à la fois concernant l'interface et les résultats, je suis très déçu. Je trouve dommage qu'ils n'aient pas attendu un peu plus avant de sortir une version publique, parce que là les résultats de sont pas du tout décents :/. Ils auraient pu faire une beta privée ou un truc du genre non ?

Là le buzz part mal quand même...
 
WRInaute accro
wullon a dit:
Rien à dire de plus, à la fois concernant l'interface et les résultats, je suis très déçu. Je trouve dommage qu'ils n'aient pas attendu un peu plus avant de sortir une version publique, parce que là les résultats de sont pas du tout décents :/. Ils auraient pu faire une beta privée ou un truc du genre non ?

Là le buzz part mal quand même...

C'est un peu l'idée... quand GG sort une béta ca s'appelle GG News et c toujours en béta

Quand Wikia sort une alpha, ca a le niveau de pertinence de Maitre Fung Shu sur sa plage

C'est le problème quand on fixe une date et qu'on respecte pas les délais... on est obligé de sortir des trucs pareils après
 
WRInaute passionné
Tiens autre requête intéressante : "référencement google"

voici les premiers résultats :

Supevents.info, maroc, voyage maroc, immobilier maroc, casablanca maroc, tourisme maroc, maroc rabat
... rencement, référencement gratuits, référencement positionnement, référencement manuel, reussir référencement, référencement ...
-http://www.supev... - Cached - 1.41
Agence a Daumas immobilier à Mandelieu - Agence Immobilière - (real estate) - vente location
... Faites confiance à Daumas Immobilier. Référencement Google A W Referencement ...
-http://www.daumim.../ - Cached - 1.00
Agence a Daumas immobilier à Mandelieu - Agence Immobilière - (real estate) - vente location
... Faites confiance à Daumas Immobilier. Référencement Google A W Referencement ...
-http://www.daumim..../ - Cached - 1.08
Référencement: actualité SEO berSZerkers [indeXweb.info]
... SEO : propagande, angélisme et réalisme Référencer c’est communiquer. Communiquer ... une profession Le temps du ré ...
-http://www.indexw.....l - Cached - 1.08
Moteur sexe gratuit
... COM Site de Référencement gratuit, moteur de Transsexuels Gratuit ... COM Site de Référencement gratuit, moteur de Transsexuels Gratuit ...
-http://www.homes-seeke.../ - Cached - 1.08
 
WRInaute discret
J'ai pas trop compris ce que tu veux dire pas influencer les autres moteurs...

Influencer sur le faite d'incité à faire entrer dans l'algo les modification humaine?
 
WRInaute occasionnel
Oui, c'est à cela que je pensais. si ton site est mal noté dans Wikia, est-ce que cela va le faire descendre dans Google ?
 
WRInaute occasionnel
C'ets juste ce que je voulais savoir donc. Wikia sera donc sans moi, Google étant le moteur numéro 1, je ne voit pa sl'intérêt de metter en place un sytème que ce drnier n'aime pas.
 
WRInaute accro
Ripper Roo a dit:
C'ets juste ce que je voulais savoir donc. Wikia sera donc sans moi, Google étant le moteur numéro 1, je ne voit pa sl'intérêt de metter en place un sytème que ce drnier n'aime pas.
De la servilité à l'esclavage, il y a juste une petite marche glissante :)
 
WRInaute accro
Ripper Roo a dit:
C'ets juste ce que je voulais savoir donc. Wikia sera donc sans moi, Google étant le moteur numéro 1, je ne voit pa sl'intérêt de metter en place un sytème que ce drnier n'aime pas.

pour d'hypothétiques futurs visiteurs.


Néanmoins, ni Google ni d'autres moteurs ne te demande
de changer quelque chose de "bien" sur tes sites.
Le contenu, msieurdame, le contenu, ya que ça d'vrai
:lol:
 
WRInaute occasionnel
Thierry Bugs a dit:
Néanmoins, ni Google ni d'autres moteurs ne te demande
de changer quelque chose de "bien" sur tes sites.
Le contenu, msieurdame, le contenu, ya que ça d'vrai
:lol:

Je suis bien d'accord. Pourtant google nous a demandé il y a quelques années de mettre un SiteMap sur notre site pour l'aider à indexer nos pages, et nous avnos tous foncé tête baissé.
 
WRInaute accro
sietjp a dit:
Je suis bien d'accord. Pourtant google nous a demandé il y a quelques années de mettre un SiteMap sur notre site pour l'aider à indexer nos pages, et nous avnos tous foncé tête baissé.

Parle pour toi... j'ai pas de sitemap... 40.000 pages dans un sitemap... GG aime pas
 
WRInaute occasionnel
finstreet a dit:
sietjp a dit:
Je suis bien d'accord. Pourtant google nous a demandé il y a quelques années de mettre un SiteMap sur notre site pour l'aider à indexer nos pages, et nous avnos tous foncé tête baissé.

Parle pour toi... j'ai pas de sitemap... 40.000 pages dans un sitemap... GG aime pas
Bin non je parle pas pour moi, je suis dans ton cas, 2M de pages... Et même si je n'avais que 2 pages jene ferais pas de sitemap.
 
Discussions similaires
Haut