Les entreprises spécialisées dans l'IA dépendent des éditeurs de premier plan pour leurs données d'entraînement, selon une nouvelle étude

- OpenAI et Google, deux géants de l'IA, utilisent des articles provenant des principaux médias pour entraîner leurs modèles de langage.
- D'après une étude réalisée par Ziff Davis, les sources sont filtrées en fonction du classement dans les résultats de recherche.
- Les éditeurs craignent que les entreprises spécialisées en IA utilisent leur contenu sans autorisation.
Les grandes entreprises technologiques, dont OpenAI, Google, Meta et Anthropic, s'appuient sur du matériel de haute qualité protégé par le droit d'auteur provenant d'éditeurs de renom pour entraîner leurs grands modèles de langage (LLM).
Elle Une étude révèle que les entreprises spécialisées en IA privilégient les sources faisant autorité pour l'entraînement de leurs jeux de données, afin d'optimiser les performances des modèles. Or, la contribution de ces sources est souvent négligée.
Dans cette étude, George Wukoson, avocat spécialisé en IA chez Ziff Davis, et Joey Fortuna, directeur technique, affirment que les entreprises d'IA choisissent leurs données d'entraînement en fonction du classement de sites web faisant autorité et bénéficiant d'un excellent référencement. Les sites web populaires et de haute qualité sont sélectionnés pour améliorer les modèles, car ils jouissent d'une bonne réputation. Cette stratégie permet, selon l'étude, aux développeurs d'IA d'affiner le modèle de langage.
Ziff Davis a souligné que des fournisseurs de contenu de premier plan comme Axel Springer, Future PLC, Hearst, News Corp et le New York Times, entre autres, ont contribué au développement des ensembles de données d'entraînement. Il a notamment étédentque 12,04 % d'OpenWebText2, utilisé pour la création du GPT-3 d'OpenAI, provenaient de ces éditeurs de confiance.
Mark Zuckerberg a également pris position dans le débat actuel sur l'utilisation du contenu pour l'entraînement des IA. Dans une récente interview accordée à The Verge, il a reconnu que l'extraction de données pour l'IA est complexe, mais a également souligné que le contenu des créateurs ou éditeurs individuels pourrait ne pas avoir un impact aussi important qu'on le souhaiterait. Il a déclaré: « Je pense que les créateurs ou éditeurs individuels ont tendance à surestimer la valeur de leur contenu dans le contexte global. »
Des éditeurs intentent des poursuites contre des entreprises spécialisées dans l'IA
Le secret qui entoure les sources de données d'entraînement suscite des inquiétudes tant chez les éditeurs que chez les consommateurs. Le New York Times et le Wall Street Journal ont récemment porté plainte contre des entreprises d'IA, les accusant de violation de droits d'auteur pour utilisation de leur contenu.
Bien qu'OpenAI ait fait des efforts considérables pour obtenir des licences de contenu auprès d'organisations médiatiques telles que le Financial Times et DotDash Meredith, plusieurs entreprises spécialisées en IA continuent de travailler sans licence adéquate. Le rapport indique par ailleurs que « les principaux développeurs de modèles de modélisation de l'apprentissage automatique (LLM) ne divulguent plus leurs données d'entraînement comme ils le faisaient auparavant ».
Alors que la valeur des entreprises d'IA augmente, le fossé entre les géants de la technologie et les médias traditionnels demeure immense. Des entreprises comme Google et Meta, estimées respectivement à 2 200 milliards et 1 500 milliards de dollars, restent à la pointe de l'IA générative, tandis que des startups telles qu'OpenAI et Anthropic sont valorisées respectivement à 157 milliards et 40 milliards de dollars.
Par ailleurs, les éditeurs continuent de faire face à des licenciements et des restructurations, témoignant des difficultés financières liées à leur adaptation à un environnement de plus en plus defipar l'IA. Face à la concurrence des contenus générés par les utilisateurs et des contenus basés sur l'IA, de nombreux éditeurs doivent relever le défi de la réduction des coûts et des effectifs.
Il existe un juste milieu entre laisser son argent à la banque et miser sur les cryptomonnaies. Commencez par regarder cette vidéo gratuite sur la finance décentralisée.
Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)















