DERNIÈRES NOUVELLES
SÉLECTIONNÉ POUR VOUS
HEBDOMADAIRE
RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

L'IA ne peut prospérer sans connaissances humaines – une compensation pour les créateurs originaux est indispensable

ParAamir SheikhAamir Sheikh
3 minutes de lecture -
Connaissance humaine
  • L'entraînement des modèles d'IA nécessite de vastes ensembles de données, et il est préférable qu'ils soient basés sur les connaissances humaines.
  • Les journaux et les organismes de recherche, ainsi que les portails web, consacrent leurs ressources à la collecte et à la publication d'informations.
  • La rémunération des créateurs originaux de contenu est indispensable, car les entreprises spécialisées en IA acquièrent désormais des licences de contenu auprès d'autres entreprises.

L'entraînement des modèles d'IA nécessite d'énormes quantités de données, et leur capacité à produire de bons résultats dépend directement des données qui alimentent le système. L'information a un coût, et il s'agit ici de nombreux droits de propriété intellectuelle. 

Mais les entreprises spécialisées en IA ne raisonnent pas ainsi ; elles tiennent pour acquis tout le savoir produit par des générations d’auteurs ; leur conception de l’utilisation équitable est également différente de celle qu’elle avait à l’origine ; et elles rechignent à rémunérer les créateurs de contenu qui ont permis à leurs modèles d’atteindre leurs performances actuelles.

Le vol du savoir humain

La production du contenu que nous voyons dans les journaux, les magazines, les livres, les archives en ligne et les articles de recherche exige beaucoup de travail et d'efforts, mais cela ne serait pas possible sans les auteurs, les rédacteurs, les chercheurs et les éditeurs qui ont mis ce contenu à la disposition du public sous différentes formes.

Une telle reconnaissance et un tel savoir-faire durement acquis ne devraient pas pouvoir être exploités librement par une entreprise, comme cela a été le cas.

« Les informations accessibles au public sur Internet. »

Source : OpenAI.

Oui, c'est ce qu'OpenAI répond lorsqu'on l'interroge sur le contenu utilisé pour entraîner ses systèmes d'IA, ainsi que sur les informations acquises sous licence auprès de tiers et celles fournies par leurs utilisateurs et formateurs humains. 

Concernant les contenus sous licence, les entreprises les recherchent actuellement, mais nous ignorons si OpenAI a acquis des licences auprès d'un fournisseur avant le lancement de son modèle GPT initial. Ce modèle a donc dû être entraîné sur des documents protégés par le droit d'auteur et non libres d'utilisation à des fins commerciales.

Source : Statista.

Rémunération des créateurs originaux

Il y a encore un an, la plupart des textes, en ligne comme hors ligne, étaient le fruit du travail humain. Malgré les titres racoleurs et la présence de contenus de faible qualité, ces derniers étaient au moins créés par des humains qui comprenaient la psyché et le processus de pensée humains, et les applications d'IA générative étaient développées à partir de ces connaissances. 

Aujourd'hui, les entreprises sont confrontées à un nouveau problème pour l'entraînement de leurs modèles d'IA : le contenu généré automatiquement qui prolifère sur Internet et qui est loin d'être considéré comme un contenu de qualité. Ce type de contenu sature les ressources disponibles pour l'entraînement des modèles d'IA, car ces derniers ne peuvent produire de résultats de qualité lorsqu'ils sont entraînés sur des données verbeuses et inutiles, qui constituent pourtant leur mode de production habituel. Ce phénomène d'auto-entraînement des IA est souvent qualifié de cannibalisme ou de clonage de l'IA.

Pour éviter cela, les entreprises spécialisées en IA doivent limiter leurs sources aux seuls médias crédibles, à savoir les journaux, les magazines et les forums publics qui regorgent de connaissances produites par l'humain. On pourrait en citer d'autres, comme mentionné précédemment, mais cette nécessité et les poursuites judiciaires intentées par les journaux les ont contraints à acquérir des licences de contenu et à payer pour l'exploitation dont ils se livraient.

Des entreprises comme Reddit, un vaste forum public hébergé sur le web, envisagent également de concéder des licences pour leur contenu à des sociétés spécialisées en intelligence artificielle. Dans un communiqué, Reddit a déclaré privilégier les négociations commerciales aux poursuites judiciaires, sans toutefois exclure cette possibilité en cas d'échec des discussions. Si l'utilisation d'unetracsur YouTube, pourquoi une société d'IA devrait-elle être autorisée à l'utiliser pour entraîner ses modèles destinés à un usage commercial ?

La question des droits d'auteur pose problème, car les entreprises spécialisées en IA les violent régulièrement. Par ailleurs, l'IA est incapable de collecter de nouvelles informations par elle-même ; le travail humain est indispensable pour recueillir et vérifier les informations auprès de différentes sources avant leur publication. Ce n'est qu'ensuite qu'un modèle d'IA peut utiliser ces informations, et le fait de ne pas rémunérer le personnel dans ce processus constitue une exploitation. 

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les !

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. Cryptopolitandécline toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Aamir Sheikh

Aamir Sheikh

Aamir est un journaliste spécialisé dans les technologies, fort de près de six ans d'expérience dans les secteurs des cryptomonnaies et des technologies. Diplômé de l'université MAJ avec un MBA en finance et marketing, il travaille actuellement pour Cryptopolitan, où il couvre l'actualité des marchés des cryptomonnaies et propose des prévisions de prix.

PLUS D'ACTUALITÉS
COURS ACCÉLÉRÉ SUR LES CRYPTOMONNAIES