L'objectif du système décrit dans ce brevet est d'identifier les listes ou fiches frauduleuses d'entreprises (des fiches locales telle que celles de My Business que l'on trouve dans Google Maps).
Plus précisément, l'invention concerne la détermination d'un niveau de surprise ("surprisingness") pour une combinaison particulière de mots dans le titre d'entreprise basée sur la probabilité que la combinaison est apparue dans les titres d'entreprises légitimes.
Ainsi, cette valeur peut être utilisée pour déterminer si la fiche d'entreprise ou l'entreprise est légitime ou frauduleuse.
Par exemple, ce système antispam permet de repérer ceux qui cherchent à positionner une fausse fiche d'entreprise en se faisant passer pour une entreprise connue afin de lui passer devant dans les résultats. Une fiche peut être identifiée comme "spam" si son titre contient des combinaisons de mots trop "surprenantes".
On voit aussi dans les exemples fournis que ça permettrait d'identifier des spammeurs qui utilisent des descriptions, adresses ou avis d'autres fiches avec leur propre nom (cf. l'exemple ci-dessous d'un serrurier).
Voici les synopsis du brevet :

Suite :

Matrice de co-occurrence des termes utilisés dans les titres et les fiches :

Matrice de co-occurrence normalisée :

Exemple de spam :

Références du brevet : "Systems and methods of detecting keyword-stuffed business titles" inventé par Baris Yuksel et Lev Ratinov, déposé le 09/05/2013 et obtenu le 15/09/2015 sous le n°9,135,625 USPTO.
Source : USPTO
Si vous avez des questions, posez-les dans le forum WebRankInfo.
Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.
➡️ Offre MyRankingMetrics ⬅️
pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)
Voir les détails ici

Laisser un commentaire