Le nouveau modèle d'IA d'Alibaba, QwQ-32B-Preview, surpasse o1 d'OpenAI dans certains tests de performance

- Le modèle d'Alibaba a surpassé OpenAI dans des tests de référence tels que AIME et MATH.
- Ce modèle pourrait constituer un pas vers une IA raisonnante.
- Cependant, ce modèle a aussi ses limites.
Face à l'intensification de la concurrence dans le domaine de l'IA, le géant chinois du commerce de détail Alibaba a dévoilé son QwQ-32B-Preview qui, selon les informations, surpasse la série o1 d'OpenAI.
Le dernier modèle surpasserait les modèles o1-preview et o1-mini d'OpenAI sur certains benchmarks spécifiques, tels que les tests AIME et MATH, qui évaluent les performances des modèles d'IA dans les puzzles logiques et les problèmes mathématiques.
Alibaba a mis en ligne QwQ-32B-Preview.
Selon le géant du commerce de détail, le nouveau modèle d'Alibaba est capable de s'attaquer à des problèmes complexes et subtils, contrairement aux grands modèles de langage (LLM) classiques comme ChatGPT-4 et Claude 3.5.
Un article de Benzinga indique que le modèle QwQ-32B-Preview est l'un des rares disponibles sous une licence permissive, permettant aux utilisateurs de le télécharger et de l'utiliser. Il est désormais disponible sur la plateforme de développement d'IA Hugging Face.
Cependant, Alibaba a publié certains éléments du modèle afin de limiter sa réplication intégrale ou la compréhension de son fonctionnement.
Le dernier modèle d'Alibaba dispose de 32,5 milliards de paramètres, ce qui lui permet de traiter des requêtes allant jusqu'à 32 000 mots. Grâce à ses capacités exceptionnelles et à son accessibilité semi-ouverte, ce nouveau modèle d'Alibaba ouvre la voie à une avancée majeure dans le domaine des technologies de raisonnement par intelligence artificielle.
Alors qu'Alibaba a fait une annonce transparente soulignant la sophistication de son modèle, OpenAI a gardé le nombre de ses paramètres secret.
L'arrivée de ce modèle intervient à un moment où OpenAI réalise des progrès considérables dans le secteur de l'IA. En octobre, la valorisation d'OpenAI a bondi à 157 milliards de dollars suite à une levée de fonds réussie.
Plus tôt cette semaine, SoftBank Group (SFTBF) aurait augmenté sa participation dans le créateur de ChatGPT grâce à un rachat d'actions par les employés d'une valeur de 1,5 milliard de dollars.
OpenAI envisagerait également de développer son propre navigateur web pour concurrencer Google Chrome, filiale d'Alphabet, suite aux pressions exercées par le ministère américain de la Justice pour qu'il s'en sépare.
Alibaba admet également que le modèle présente des défauts
Bien qu'il possède certains atouts uniques, le nouveau modèle présente également des limitations. Selon le groupe, QwQ-32B-Preview souffre notamment de changements de langue inattendus, susceptibles de perturber les utilisateurs. Le modèle est également moins performant dans les tâches nécessitant un raisonnement de bon sens, ce qui est fréquent avec de nombreux systèmes d'IA.
Selon AutoGPT, le modèle peut se retrouver piégé dans des boucles logiques, retardant ainsi les réponses.
Malgré ses lacunes, ses capacités de raisonnement lui permettent de vérifier les faits elle-même, réduisant ainsi les erreurs mais augmentant le temps de résolution.
En raisonnant par étapes et en planifiant les tâches, le modèle d'Alibaba évite certains écueils des systèmes d'IA traditionnels. Cependant, cette approche exige plus de temps, ce qui peut limiter les applications en temps réel.
Selon Benzinga, les réponses de QwQ-32B-Preview sont conformes aux normes réglementaires chinoises, évitant les sujets politiquement sensibles.
Par exemple, sur des sujets politiquement sensibles comme Taïwan, les réponses seront conformes à la position du gouvernement chinois.
De plus, les questions portant sur des événements comme celui de la place Tiananmen ne suscitent aucune réponse, ce qui témoigne de la conception prudente du modèle.
Bien que ce modèle soit idéal pour le marché chinois, il risque de limiter son attrait à l'échelle mondiale. Il représente néanmoins une avancée significative dans le domaine de l'IA raisonnante. Si ses limitations peuvent restreindre sa portée internationale, d'autres aspects, comme sa logique et sa nature semi-ouverte, en font un concurrent de taille pour OpenAI.
Selon AutoGPT, QwQ-32B-Preview met en lumière le potentiel et les défis de cette frontière passionnante où les laboratoires d'IA du monde entier travaillent à affiner la technologie de raisonnement.
Ne vous contentez pas de lire les actualités crypto. Comprenez-les. Abonnez-vous à notre newsletter. C'est gratuit.
Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)














