- Le dernier modèle d'OpenAI, ChatGPT-4o, « donne l'impression d'être une IA tout droit sortie d'un film »
- Il peut accepter et renvoyer des requêtes combinant texte, audio et images.
- Elle répond avec une voix plus empathique qu'un modèle d'IA classique.
OpenAI a dévoilé lundi son dernier modèle phare , GPT-4o (« o » pour « omni »), et il semble que ce soit ce qui se rapproche le plus d'un assistant intelligent comme « Jarvis » dans le film Iron Man.
L'atout majeur de ChatGPT-4o réside dans sa capacité à gérer différentes modalités, contrairement à la plupart des modèles d'IA existants. Concrètement, cela signifie que GPT-4o peut accepter et générer n'importe quelle combinaison de requêtes textuelles, audio et visuelles.
La démonstration présentée par l'équipe sur X (anciennement Twitter) était tellement impressionnante qu'elle a suscité un véritable engouement. L'un de ses principaux exploits réside dans la capacité de GPT-4o à répondre aux entrées audio en seulement 232 millisecondes, un temps de réponse comparable à celui d'un humain lors d'une conversation.
« On dirait une IA de film ; et j’ai encore du mal à croire que ce soit réel », a écrit Sam Altman, PDG d’OpenAI, dans un article de blog publié lundi. « Atteindre des temps de réponse et une expressivité comparables à ceux des humains représente un changement majeur. »
OpenAI a commencé à déployer les fonctionnalités de texte et d'image de GPT-4o auprès des utilisateurs. Dans les semaines à venir, les fonctionnalités audio et vidéo seront mises à disposition d'un petit groupe de partenaires de confiance au sein de l'API, a indiqué l'entreprise.
Néanmoins, voici quelques exemples de ce que vous pouvez faire avec le modèle ChatGPT-4o.
Ce que vous pouvez faire avec GPT-4o
Créer des images avec des textes lisibles
Jusqu'à présent, certains générateurs d'images par IA, comme Midjourney, peinaient encore à créer des images avec du texte lisible. OpenAI a annoncé que GPT-4o comprend désormais beaucoup mieux les descriptions textuelles et peut afficher du texte lisible sur les images.

Traduction en temps réel
Dans les situations où un traducteur est nécessaire, GPT-4o peut jouer ce rôle. Lors d'une démonstration vidéo, l'équipe d'OpenAI a montré que GPT-4o pouvait traduire de l'anglais en espagnol, et peut-être dans d'autres langues, puis de l'espagnol vers l'anglais.
Regardez et dites
Pour les personnes malvoyantes, ou simplement par curiosité, ChatGPT-4o peut observer et interpréter l'environnement grâce à la caméra du téléphone. Par exemple, le modèle a pu identifier une fête d'anniversaire en repérant un cake et une bougie dans la pièce.
Résoudre des problèmes mathématiques
GPT-4o peut également analyser des problèmes de mathématiques sur une feuille de papier ou un écran et en fournir la réponse. De plus, il peut vous accompagner et vous guider dans l'apprentissage de la résolution de ces problèmes.
L'IA dans les réunions visuelles
GPT-4o peut participer à des réunions vidéo et dialoguer avec les participants. Il peut également aider les utilisateurs à se préparer aux entretiens d'embauche.
Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.
Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)
















