Dans une révélation discrète qui a eu un retentissement bien plus important dans le milieu technologique que n'importe quelle annonce officielle, Apple et des chercheurs de l'Université Cornell ont subtilement dévoilé Ferret au monde entier en octobre dernier. Ce modèle de langage multimodal et open source (LLM) rompt avec la tradition de secret d'Apple et marque une avancée significative dans le domaine de l'intelligence artificielle. Utilisant des images comme requêtes, le lancement discret de Ferret sur GitHub a suscité un vif intérêt parmi les passionnés et les chercheurs en intelligence artificielle.
Dans le silence qui règne autour de l'innovation, Apple et des chercheurs de l'université Cornell ont, de manière inattendue, présenté en octobre dernier un modèle de langage multimodal de grande taille (LLM) en open source, baptisé Ferret. Cette publication non annoncée sur GitHub est passée inaperçue, mais a depuis captivé l'attention de la communauté de l'IA.
L'opération ingénieuse de Ferret – Un examen plus approfondi
Le mode opératoire de Ferret consiste à examiner des régions spécifiques d'une image, àdentles éléments pertinents et à les encadrer. Cette approche novatrice permet aux utilisateurs d'utiliser ces éléments comme requêtes, ce qui incite Ferret à répondre de manière classique.
Par exemple, lorsqu'un utilisateur sélectionne l'image d'un animal et interroge Ferret sur son espèce, le modèledentidentifie et répond en conséquence. Ferret peut même exploiter le contexte d'autres éléments de l'image pour fournir des réponses plus détaillées, offrant ainsi un aperçu de ses capacités multimodales uniques.
Le modèle Ferret open-source, caractérisé par sa capacité à référencer et à établir des liens entre divers éléments à différents niveaux de granularité, marque un tournant important pour Apple, comme l'indiquent les informations partagées par Zhe Gan, chercheur en IA chez Apple.
Réputée pour sa discrétion, la volonté d'Apple de partager ses avancées en IA avec la communauté open source est perçue comme une initiative surprenante. Cette ouverture inédite positionne Apple comme un acteur majeur de l'IA multimodale, bousculant les attentes du secteur.
Le virage stratégique d'Apple – Naviguer dans le paysage de l'IA
La sortie de Ferret marque non seulement l'entrée d'Apple dans le domaine de l'IA open source, mais reflète également la réponse stratégique de l'entreprise aux défis du secteur. Comme le souligne le blogueur spécialisé en technologie Ben Dickson, Apple doit faire face à une forte concurrence de la part de rivaux tels que Microsoft et Google en raison des limitations de ses ressources informatiques. Contrairement à des modèles comme ChatGPT, l'infrastructure d'Apple n'est pas conçue pour gérer des modèles de langage de grande taille (MLG) à grande échelle.
Cette situation place Apple à la croisée des chemins, face à deux options viables. La première consiste à nouer des partenariats stratégiques avec des fournisseurs de services cloud hyperscale afin de renforcer ses capacités en IA. La seconde, comme l'indique le lancement de Ferret, est d'adopter une approche open source, à l'instar de la stratégie mise en œuvre par Meta Platforms Inc. Ce choix entre collaboration et partage communautaire témoigne de la volonté d'Apple de rester compétitive dans le paysage de l'IA en constante évolution.
Alors que Ferret explore discrètement des territoires inexplorés dans le domaine de l'IA multimodale, Apple se trouve à un tournant décisif qui dépasse la simple innovation technologique. La publication de cette merveille open source soulève une question complexe quant à l'avenir d'Apple dans le domaine de l'IA.
Ferret propulsera-t-il Apple à l'avant-garde de l'IA multimodale, remettant en question les normes du secteur et favorisant les avancées collaboratives ? Ou symbolise-t-il un changement plus profond dans le paysage de l'IA, où les géants du secteur concilient expertise propriétaire et innovation collective ? L'arrivée discrète de Ferret continue de susciter des interrogations quant au rôle évolutif d'Apple dans l'avenir de l'intelligence artificielle. La réponse se trouve à la croisée des chemins entre technologie, collaboration et dynamique en constante évolution du discours sur l'IA.

