Bonjour,
Y-a-t-il des pros du data mining dans la salle ?
Je ne trouve pas la moindre info, si quelqu'un pouvait m'aider en me mettant sur la piste, ca serait sympa....
Cas fictif, mais qui pourrait m'aider a expliquer :
Soit une base de donnees utilisateurs comportant plusieurs millions d'utilisateurs. (d'ou l'interet d'utiliser des vrais algos, pas des trucs a l'arrache)
Chaque utilisateur possede des attributs : sexe, age, poids, ville, etc...
Comment effectuer une recherche, un "match", entre deux profils de maniere la plus efficace possible ?...
Par exemple une personne A recherche qqun de X ans et d'un poids Y.
Le but etant de ressortir les profils les plus pertinants et d'eviter les profils qui ne le sont pas.
Mais de maniere optimisee, c'est a dire, ne pas lire 100% des enregistrements de la table, et ne pas les comparer betement a un a un....
Limiter le nombre d'enregistrement a prendre, je vois a peu pres....
Il me suffit dans mon SELECT de limiter en prenant les criteres de selections tres important et discrimants...
Genre : SELECT * FROM users WHERE age > x_min AND age < x_max AND {CRITERES IMPORTANTS ICI}
Supposons que de 10'000'000 d'enregistrements, je sois passe a un echantillon de 50'000...
C'est une enorme avancee, mais 50'000 enregistrements a comparer betement dans une boucle ca prend du temps quand meme.... :cry:
Il y a surement des moyens mathematiques de faire ressortir que les n profils les plus pertinents rapidement....
Bref, si vous avez la moindre idee ou indice, je suis preneur :lol:
Merci
Y-a-t-il des pros du data mining dans la salle ?
Je ne trouve pas la moindre info, si quelqu'un pouvait m'aider en me mettant sur la piste, ca serait sympa....
Cas fictif, mais qui pourrait m'aider a expliquer :
Soit une base de donnees utilisateurs comportant plusieurs millions d'utilisateurs. (d'ou l'interet d'utiliser des vrais algos, pas des trucs a l'arrache)
Chaque utilisateur possede des attributs : sexe, age, poids, ville, etc...
Comment effectuer une recherche, un "match", entre deux profils de maniere la plus efficace possible ?...
Par exemple une personne A recherche qqun de X ans et d'un poids Y.
Le but etant de ressortir les profils les plus pertinants et d'eviter les profils qui ne le sont pas.
Mais de maniere optimisee, c'est a dire, ne pas lire 100% des enregistrements de la table, et ne pas les comparer betement a un a un....
Limiter le nombre d'enregistrement a prendre, je vois a peu pres....
Il me suffit dans mon SELECT de limiter en prenant les criteres de selections tres important et discrimants...
Genre : SELECT * FROM users WHERE age > x_min AND age < x_max AND {CRITERES IMPORTANTS ICI}
Supposons que de 10'000'000 d'enregistrements, je sois passe a un echantillon de 50'000...
C'est une enorme avancee, mais 50'000 enregistrements a comparer betement dans une boucle ca prend du temps quand meme.... :cry:
Il y a surement des moyens mathematiques de faire ressortir que les n profils les plus pertinents rapidement....
Bref, si vous avez la moindre idee ou indice, je suis preneur :lol:
Merci