OpenAI a publié une nouvelle série d'outils destinés à aider les entreprises à créer des agents d'IA spécialisés. Ces outils simplifieront la création de systèmes automatisés capables d'accomplir des tâches spécifiques grâce aux modules linguistiques et aux frameworks existants d'OpenAI.
Ce nouvel ensemble d'outils d'IA est similaire au produit Operator d'OpenAI. Il fait partie du nouveau service API Responses de l'entreprise. Les agents d'IA effectueront diverses tâches telles que la recherche sur Internet, la navigation sur des sites web et l'analyse des fichiers de l'entreprise. Ces nouveaux agents et outils d'IA remplacent en grande partie l'API Assistants d'OpenAI, qui sera abandonnée fin 2026.
L'API Responses aide les développeurs à créer des applications d'agents
L'API Responses comprend des composants qui alimentent les agents d'IA et aident les développeurs à créer des applications exploitant les technologies Operator et Deep Research d'OpenAI. La création de telles applications d'agents pourrait déboucher sur des solutions plus autonomes que les applications d'IA actuelles.
L'API Responses permettra aux développeurs d'accéder aux mêmes modèles d'IA que ceux utilisés par ChatGPT Search, notamment GPT-4o Search et GPT-4o Mini Search. Ces modèles peuvent naviguer sur Internet pour répondre aux questions en citant leurs sources .
Les résultats du test SimpleQA d'OpenAI ont démontré que GPT-4o Search et GPT-4o Mini présentent une grande factuelle . Pour à des questions courtes et factuelles, GPT-4o Search a obtenu un score de 90 %, suivi de GPT-4o Mini Search avec 88 %. En revanche, GPT-4.5, malgré sa taille plus importante, n'a atteint que 63 %.
L'API Responses intègre une fonctionnalité de recherche de fichiers permettant de parcourir rapidement les fichiers des bases de données d'une organisation afin d'en extraire des informations. OpenAI précise qu'elle n'utilisera pas ces fichiers ou bases de données pour entraîner ses modèles LLM. Les développeurs peuvent exploiter ce modèle pour automatiser des tâches telles que la saisie de données et les flux de travail applicatifs en générant des actions à la souris et au clavier.
De plus, le modèle CUA (Computer-Using Agent) d'OpenAI, qui alimente Operator, est accessible aux développeurs via l'API Responses. OpenAI précise que le modèle CUA est disponible uniquement en version préliminaire pour la recherche, et que les entreprises ont la possibilité d'exécuter des modèles CUA sur leurs serveurs locaux.
D'après un article du Wall Street Journal, Stripe, la plus grande entreprise privée de technologies financières, a utilisé la technologie générative d'OpenAI pour créer un prototype d'agent IA. Cet agent est capable de lire un tableur de ventes, de générer des factures et de les envoyer aux clients via la plateforme d'IA de Stripe.
Aaron Levie, PDG de Box, a déclaré que l'entreprise de stockage cloud simplifie le développement d'agents personnalisés pour ses clients professionnels grâce à la plateforme OpenAI. Ces agents s'intègrent parfaitement à toutes les données stockées sur Box.
La nouvelle API d'OpenAI ne représente pas un progrès majeur pour l'IA agentielle
Le créateur de ChatGPT a indiqué que le modèle CUA n'est pas suffisamment fiable pour l'automatisation des tâches sur les systèmes d'exploitation et qu'il peut engendrer des erreurs involontaires. L'entreprise a précisé que ces outils constituent des versions préliminaires de ses solutions d'automatisation et qu'elle travaille constamment à leur amélioration.
Parallèlement à la publication de l'API Responses, OpenAI met également à disposition un kit de développement logiciel (SDK) open source appelé Agents. Ce kit permet aux développeurs d'intégrer des modèles LLM aux systèmes internes de leur entreprise, de superviser les activités d'IA multi-agents à des fins d'optimisation et de débogage, et de mettre en œuvre des mesures de sécurité gratuitement. Le SDK Agents succède à Swarm, un framework qui simplifie l'orchestration de plusieurs agents grâce à une interface transparente et minimaliste.
Olivier Godemont, responsable des produits API chez OpenAI, a déclaré que « les agents représentent l'application de l'IA la plus marquante à venir ». Il a précisé qu'il est facile de faire la démonstration d'un agent IA, mais difficile de le déployer à grande échelle et de convaincre les utilisateurs de son utilisation réelle. M. Godemont reste optimiste quant à la capacité d'OpenAI à concrétiser cette vision.

