Microsoft a annoncé un petit modèle de langage d'intelligence artificielle capable d'effectuer des tâches telles que la rédaction de publications sur les réseaux sociaux et la création de contenu en utilisant moins de données.
Le géant de la technologie a déclaré dans un communiqué que son nouveau modèle léger appelé Phi-3-mini avait la capacité de surpasser des modèles plus grands dix fois plus grands lorsqu'il était testé pour une gamme de critères tels que les capacités de codage, de mathématiques et de langage.
Phi-3 est une solution adaptée aux petites entreprises
Microsoft a déclaré que ces types de modèles plus petits permettent aux petites entreprises disposant de ressources limitées d'effectuer plus facilement des tâches plus simples, car ils sont conçus avec cette approche à l'esprit.
Phi-3 pourrait être utilisé par une entreprise pour trac des informations pertinentes et des tendances commerciales à partir de rapports d'études de marché et pour récupérer et résumer les principaux points d'un long document, a expliqué Microsoft.
Phi-3 sera disponible instantanément sur le catalogue de modèles d'IA d'Azur, qui est la plateforme de services cloud de Microsoft, sur Hugging Face, qui est une plateforme de test et de déploiement de modèles d'apprentissage automatique, et également sur Ollama, qui est une plateforme qui fournit des cadres pour modèles en cours d'exécution.
Davantage de modèles Phi-3 seront dotés de plus de capacités
Phi-3 est capable de gérer 3,8 milliards de paramètres et est entraîné sur beaucoup moins de données par rapport aux grands modèles de langage comme Gemini ou GPT-4. Microsoft a publié Phi-2 à la fin de l'année précédente. Les experts affirment qu’il fonctionne aussi bien que certains des modèles plus grands. Le Phi-3 devrait être encore plus performant que son prédécesseur.
Microsoft prévoit d'introduire deux autres versions du modèle, puisqu'il s'agit de la première de la gamme, un Phi-3 Small et un Phi-3 Medium, avec différentes capacités de paramètres allant de sept à 14 milliards.
Le modèle léger ne peut pas générer de résultats comme ceux des LLM basés sur le cloud, mais il peut rivaliser avec d'autres modèles plus petits comme Mistral et Lama-3 dans l'écriture de codes, la résolution d'équations matic et les articles universitaires.
Un autre avantage supplémentaire du Phi-3 est qu’il peut fonctionner sans connexion Internet et sur des appareils plus petits comme un téléphone portable. Phi-3 est une solution rentable pour les petites entreprises qui ne peuvent pas se permettre de recourir à de grands modèles linguistiques basés sur le cloud pour se lancer dans l'IA.
Les nouvelles originales de Reuters peuvent être consultées ici , et le document de recherche de Microsoft est ici .