Apple a annoncé hier, lors de la WWDC 2025, des mises à jour à venir de son modèle d'IA qui seront intégrées à l'ensemble de sa suite logicielle. Ce modèle a obtenu des résultats inférieurs aux performances des anciens modèles de sociétés concurrentes comme OpenAI lors de ses tests de performance. Cependant, le géant technologique a affirmé que les versions embarquée et serveur d'Apple avaient été améliorées et pouvaient désormais comprendre plus de 15 langues.
D'après des testeurs humains, le dernier modèle embarqué fonctionnant localement sur iPhone et autres appareils a obtenu des performances similaires aux anciens modèles de Google et d'Alibaba en matière de génération de texte. Ces mêmes testeurs ont classé Apple Server, conçu pour fonctionner dans les centres de données de l'entreprise, derrière GPT-40 d'OpenAI, un an après son lancement. Lors d'une autre évaluation, ils ont préféré Llama 4 de Meta à Apple Server pour l'analyse d'images. Ces résultats ont surpris Apple, car Llama 4 Scout avait obtenu de faibles performances comparé aux laboratoires d'IA tels que Google, Anthropic et OpenAI.
Les développeurs restent sceptiques quant à la promesse d'innovation d'Apple
Les développeurs sont plutôt sceptiques quant aux annonces de la WWDC de ces dernières années, notamment concernant le petit modèle d'IA embarqué d'Apple. Atul Kakkar, directeur des produits d'Origi, une application de finances personnelles basée sur l'IA, a confié qu'en tant que développeur, il n'avait pas ressenti l'enthousiasme suscité par les nouveautés de l'entreprise de Tim Cook. Il estime que la WWDC, autrefois l'événement phare du secteur technologique, est désormais empreinte de scepticisme quant à la capacité du fabricant d'iPhone à rivaliser avec les géants de l'IA.
Apple ne publie pas de résultats de tests de performance pour ses IA, se contentant de présenter une évaluation comparative directe mal documentée
Mais même selon leurs propres critères, les derniers modèles d'Apple intégrés à leurs appareils sont généralement moins performants que les modèles ouverts Gemma 3-4B de Google ou Qwen 3-4B
Et leur serveur LLM est similaire à Llama 4 Scout pic.twitter.com/hwpOG5Lgyp
– Ethan Mollick (@emollick) 10 juin 2025
Le géant technologique est sous pression pour rester compétitif en mettant constamment à jour ses outils d'IA destinés aux développeurs et en créant une expérience utilisateur captivante au sein de la suite Apple Intelligence. Grant McDonald, PDG et cofondateur de Bobo, une application de conseils parentaux basée sur l'IA, a déclaré que l'entreprise de Tim Cook fait des choses intéressantes, mais que cela ne suffit pas à se démarquer.
McDonald estime que permettre aux développeurs de créer des applications basées sur l'IA grâce à ses petits modèles d'IA embarqués pourrait constituer la valeur ajoutée que l'entreprise souhaite apporter. Ces petits modèles d'IA sont entraînés sur de petits ensembles de données et consomment moins de puissance de calcul, ce qui signifie qu'ils peuvent être exécutés sur un iPhone plutôt que sur de grands serveurs dans le cloud. Il a ajouté que l'exécution de modèles sur un appareil est en pratique moins coûteuse que celle de modèles basés sur le cloud, tels que GPT et Gemini.
Les développeurs doutent que les modèles embarqués soient aussi performants que les modèles basés sur le cloud. L'un d'eux a déclaré qu'il serait impossible de les optimiser avec un jeu de données propriétaire. McDonald a affirmé que les modèles embarqués conviendraient à certaines applications, mais pas à Bobo. Cette application parentale a personnalisé son modèle d'IA avec des données propriétaires provenant de consultants en sommeil, en lactation, d'orthophonistes et d'autres experts en parentalité.
La division de recherche en intelligence artificielle d'Apple peine à rattraper ses concurrents
Le géant technologique avait promis une mise à jour de Siri offrant un contenu plus personnalisé, mais cette mise à jour a été retardée. Certains clients ont intenté des poursuites contre l'entreprise pour avoir commercialisé des produits qui n'ont pas encore été livrés. Des chercheurs ont indiqué que si les modèles d'IA sont très performants en mathématiques et en sciences, les problèmes complexes ne donnent qu'une illusion de pensée.
Le géant technologique a retardé le développement de modèles de langage complexes et l'intégration de l'IA dans ses appareils afin de rester à l'écart des débats. Lors de la WWDC , l'entreprise a dévoilé Apple Intelligence pour ses fonctionnalités d'IA, une présentation jugée décevante par la communauté.
Des chercheurs ont découvert que les modèles de raisonnement (LRM) atteignent leurs limites à partir d'un certain seuil. Il apparaît que tous les modèles de raisonnement présentent un schéma similaire : leur précision diminue progressivement à mesure que la complexité du problème augmente, jusqu'à devenir nulle. D'après les chercheurs, les modèles de raisonnement mobilisent initialement davantage d'éléments de réflexion, mais face à l'augmentation de la complexité, ils abandonnent et, paradoxalement, leur effort de raisonnement diminue malgré la difficulté croissante du problème.
Selon Dipanjan Chatterjee, analyste chez Forrester Research, le silence autour de Siri est assourdissant. Il affirme qu'aucune correction de texte ni aucun emoji mignon ne saurait remplacer l'expérience d'IA interactive tant attendue, dont il sait que Siri est capable. Il estime que la fin de Siri est proche si l'entreprise ne réagit pas rapidement. Elle n'a pas communiqué de calendrier précis pour la mise à jour de Siri. Cependant, d'après Craig Federighi, un cadre dirigeant de l'entreprise en charge des logiciels, cette mise à jour n'interviendra pas avant l'année prochaine au plus tôt.

