Alors que la race de l'IA s'intensifie à travers le monde et se stabilise entre les super-powers économiques mondiaux, la Chine se rapproche des États-Unis, produisant de nouvelles innovations de petites entreprises d'IA.
Cela survient également alors que la Chine envisage d'améliorer l'autosuffisance et de réduire la dépendance excessive sur les produits de l'IA américains, à une époque les tensions géopolitiques s'intensifie.
Rivalité féroce alors que les petits modèles en Chine prennent la gloire
En novembre 2022, Chatgpt a été lancé avec succès immédiat. Pendant ce temps, seules deux sociétés américaines, Openai et Google, pourraient se vanter d'une IA vraiment de pointe. Maintenant, la concurrence est devenue randonnée avec plus d'entreprises en lice pour la suprématie.
Un nouveau rapport publié par l'Institut de l'IAM centré sur l'homme de l'Université de Stanford met en évidence la façon dont la situation a changé ainsi que la façon dont le champ d'IA est devenu bondé.
Aux États-Unis seulement, plus de concurrence provient des modèles Llama de Meta, le XAI d'Elon Musk, tandis que Anthropic - une entreprise qui a été fondée par d'anciens employés d'Openai, ajoute également à la pression.
Une référence populaire appelée LMSYS révèle qu'un modèle de Deepseek de Chine, R1, se classe le plus proche des principaux modèles mondiaux construits par les sociétés d'IA américaines.
«Les modèles chinois rattrapent les performances des modèles américains. Mais à travers le monde, de nouveaux joueurs émergent dans l'espace.»
Vanessa Parli, directrice de la recherche chez HAI.
Dans le classement Chatbot Arena, qui demande aux utilisateurs de voter sur les performances de divers robots, le modèle le mieux classé a obtenu environ 12% de plus que le modèle de dixième rang au début de 2024, mais seulement 5% plus élevé au début de 2025.
L' indice montre que les modèles notables génératifs d'IA sont, en moyenne, encore plus gros en utilisant plus de variables de prise de décision, plus de puissance de calcul et des ensembles de données de formation plus importants.
Mais les développeurs prouvent également que des modèles plus petits et plus élégants sont capables de grandes choses.
Grâce à de meilleurs algorithmes, un modèle moderne peut désormais correspondre aux performances qui pourraient être réalisées par un modèle 100 fois plus grand il y a deux ans.
«2024 a été une année révolutionnaire pour les modèles d'IA plus petits», explique l'indice.
Bart Selman , informaticien de l'Université Cornell à Ithaca, New York, qui n'a pas été impliqué dans la rédaction du rapport d'index, dit qu'il est bon de voir des efforts relativement petits et bon marché tels que la profondeur de la Chine prouvant qu'ils peuvent être compétitifs.
«Je prédis que nous verrons des équipes individuelles avec cinq personnes, deux personnes, qui proposeront de nouvelles idées algorithmiques qui feront bouger les choses», dit-il.
La Chine progresse rapidement alors que la domination américaine diminue
Les États-Unis continuent d'être le meilleur producteur de modèles notables, libérant 40 en 2024, par rapport aux 15 et 3 en Europe et en Europe. Mais de nombreuses autres régions rejoignent la course, y compris le Moyen-Orient, l'Amérique latine et l'Asie du Sud-Est.
Et le lead américain précédent en termes de qualité du modèle a disparu, ajoute le rapport. La Chine, qui produit le plus de publications et de brevets de l'IA, développe désormais des modèles qui correspondent à sa compétition américaine dans la performance.
En 2023, les principaux modèles chinois sont à la traîne du modèle américain supérieur de près de 20 points de pourcentage sur le test de compréhension du langage multitâche massif (MMLU), une référence commune pour les modèles de gros langues. Cependant, à la fin de 2024, la tête des États-Unis s'est effondrée à 0,3 point de pourcentage.
"Vers 2015, la Chine s'est mise sur le chemin pour être un acteur de haut niveau de l'IA, et ils l'ont fait grâce à des investissements dans l'éducation. Nous voyons que cela commence à porter ses fruits."
Selman.
Le domaine a également connu une augmentation surprenante du nombre et des performances de modèles de «poids ouvert» tels que Deepseek et le lama de Facebook.
À l'origine, les systèmes fermés, dans lesquels aucun de ces facteurs n'est divulgué, était nettement supérieur, mais l'écart de performance entre les principaux prétendants dans ces catégories s'est rétréci à 8% au début de 2024 et à seulement 1,7% au début de 2025.
«C'est certainement bon pour quiconque ne peut pas se permettre de construire un modèle à partir de zéro, qui est beaucoup de petites entreprises et universitaires», a déclaré Ray Perrault , informaticien de SRZI, un institut de recherche à but non lucratif à Menlo Park, en Californie, et codirecteur du rapport.
Openai à San Francisco, en Californie, qui a développé le chatbot Chatgpt, prévoit de publier un modèle de poids ouvert dans les prochains mois.
Clai de différence de fil : l'outil secret que les projets de crypto utilisent pour obtenir une couverture médiatique garantie