Un article - en anglais - sur la "crise" des données disponibles pour l'entrainement des IA génératives.

  • Auteur de la discussion Auteur de la discussion eldk
  • Date de début Date de début
WRInaute occasionnel
Si l'on regarde un peu les chiffres de l'étude, on voit que les auteurs de blog, ou, de "sites webs personnels", bloquent moins les robots IA et que la progression est même inverse : le "petits" auteurs sont-ils plus naïfs ou généreux et croient-ils vraiment au traffic généré par les outils d'IA génératives ?
 
WRInaute discret
Si quelqu'un à la liste des robots avec les IP pour interdire ces saletés, je suis preneur. Mon site qui contient énormément de contenu originale m'ayant demandé plusieurs années de travail se retrouve plagié et reformulé n'importe comment sur d'autres sites. L'IA aura de tout façon vécu un temps, c'est une appellation marketing usurpé, ça serait plutôt de l'agrégation de donnée, voir même du plagiat à la sauce reformulation.
 
WRInaute occasionnel
Si quelqu'un à la liste des robots avec les IP pour interdire ces saletés, je suis preneur. Mon site qui contient énormément de contenu originale m'ayant demandé plusieurs années de travail se retrouve plagié et reformulé n'importe comment sur d'autres sites. L'IA aura de tout façon vécu un temps, c'est une appellation marketing usurpé, ça serait plutôt de l'agrégation de donnée, voir même du plagiat à la sauce reformulation.
Bonjour,

Il y a quelques indications ici : https://www.webrankinfo.com/forum/t...es-robots-dia-generative.201719/#post-1633653 - voir ce que Cloudflare propose pour le blocage

Mais, pour le moment, je n'ai pas trouvé d'inventaire des ips.

Cordialement,

Eric
 
Discussions similaires
Haut