Cohere, la startup canadienne d'intelligence artificielle valorisée à 5,5 milliards de dollars, se tourne vers la création de modèles d'IA spécialisés pour les entreprises. Cette évolution marque une rupture avec les modèles traditionnels de grande envergure dans lesquels la plupart de ses concurrents investissent actuellement.
Nick Frosst, cofondateur de Cohere, a souligné que les entreprises d'aujourd'hui ont besoin de modèles conçus pour des tâches spécifiques plutôt que de modèles génériques et universels. Ce virage stratégique vers la création de modèles personnalisés s'explique par la diminution des rendements observés avec les modèles plus vastes.
Le problème des rendements décroissants liés à la mise à l'échelle des modèles d'IA
Ilya Sutskever, cofondateur des laboratoires d'IA Safe Superintelligence (SSI) et OpenAI, a indiqué que les gains obtenus grâce à l'entraînement des modèles d'IA sur de vastes ensembles de données ont atteint un plateau. Les entreprises sont désormais confrontées à des retards dans l'entraînement et le déploiement des nouvelles générations de modèles de langage à grande échelle.
L'industrie, qui avait initialement connu des avancées majeures en investissant massivement dans la puissance de calcul et les ressources pour des modèles plus grands, a commencé à reconnaître que la taille n'est pas toujours synonyme de qualité ou d'utilité.
Dans une lettre adressée à ses investisseurs, Cohere explique que cette nouvelle orientation est le résultat des difficultés rencontrées par les entreprises pour intégrer l'IA dans leur travail quotidien.
Au lieu de se concentrer sur l'intelligence artificielle générale (IAG), que certaines entreprises comme OpenAI considèrent comme l'avenir de l'IA, Cohere adopte une approche plus ciblée. L'entreprise vise à optimiser l'utilisation de son capital en adaptant ses modèles existants à des applications concrètes.
« Nous allons travailler avec les entreprises pour créer des modèles parfaitement adaptés à leur cas d'utilisation, les personnaliser en fonction de leurs besoins spécifiques et les mettre en production », a déclaré Frosst.
Il a clairement indiqué que Cohere ne miserait pas sur l'idée que l'IA générale est imminente, soulignant qu'augmenter la taille du modèle n'équivaut pas à obtenir de meilleurs résultats.
La course à la construction de meilleurs modèles
La course à la création de modèles d'IA toujours plus performants et de grande taille a engendré un boom des investissements et du développement dans le secteur. Cohere a récemment levé 270 millions de dollars lors d'un tour de table de série C, tandis que des concurrents comme OpenAI, Anthropic et d'autres laboratoires d'IA ont levé des milliards de dollars pour financer le développement de systèmes d'IA de pointe, un processus très gourmand en capitaux qui requiert souvent une puissance de calcul colossale.
Selon Cohere, l'entreprise est passée de la conception de modèles de grande taille à celle de modèles personnalisés en raison de la diminution des rendements et des retours clients. « Ce que nos clients nous disent, c'est qu'ils n'ont pas simplement besoin de modèles plus grands pour être performants dans tous les domaines. Ils ont besoin de modèles conçus spécifiquement pour leurs cas d'utilisation », a déclaré Frosst.
Cohere déploiera des versions personnalisées de modèles existants capables d'apporter une valeur ajoutée directe aux entreprises. Ses modèles seront conçus pour comprendre et exécuter des tâches très spécifiques, adaptées aux besoins de chaque entreprise, contrairement aux capacités généralistes souvent présentes dans les modèles plus vastes.
La nouvelle approche de Cohere pourrait également s'inscrire dans les tendances du secteur en matière de développement durable et de rentabilité. Face à la surveillance accrue des entreprises technologiques par les gouvernements, la stratégie de Cohere pourrait lui conférer un avantage concurrentiel dans un contexte réglementaire .
Développer des modèles d'IA de grande envergure est non seulement coûteux, mais aussi énergivore. Les entreprises spécialisées en IA pourraient avoir besoin de techniques plus économes en énergie pour mieux se positionner et se conformer aux réglementations futures, à mesure que les gouvernements s'efforcent de réduire les émissions et de mieux comprendre cette technologie.

