DERNIÈRES NOUVELLES
SÉLECTIONNÉ POUR VOUS
HEBDOMADAIRE
RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Que peut faire GPT-4o d'OpenAI ?

ParIbiam WayasIbiam Wayas
2 minutes de lecture
Que peut faire GPT-4o d'OpenAI ?
  • Le dernier modèle d'OpenAI, ChatGPT-4o, « donne l'impression d'être une IA tout droit sortie d'un film »
  • Il peut accepter et renvoyer des requêtes combinant texte, audio et images.
  • Elle répond avec une voix plus empathique qu'un modèle d'IA classique.

OpenAI a dévoilé lundi son dernier modèle phare , GPT-4o (« o » pour « omni »), et il semble que ce soit ce qui se rapproche le plus d'un assistant intelligent comme « Jarvis » dans le film Iron Man. 

L'atout majeur de ChatGPT-4o réside dans sa capacité à gérer différentes modalités, contrairement à la plupart des modèles d'IA existants. Concrètement, cela signifie que GPT-4o peut accepter et générer n'importe quelle combinaison de requêtes textuelles, audio et visuelles.

La démonstration présentée par l'équipe sur X (anciennement Twitter) était tellement impressionnante qu'elle a suscité un véritable engouement. L'un de ses principaux exploits réside dans la capacité de GPT-4o à répondre aux entrées audio en seulement 232 millisecondes, un temps de réponse comparable à celui d'un humain lors d'une conversation.

« On dirait une IA de film ; et j’ai encore du mal à croire que ce soit réel », a écrit Sam Altman, PDG d’OpenAI, dans un article de blog publié lundi. « Atteindre des temps de réponse et une expressivité comparables à ceux des humains représente un changement majeur. »

OpenAI a commencé à déployer les fonctionnalités de texte et d'image de GPT-4o auprès des utilisateurs. Dans les semaines à venir, les fonctionnalités audio et vidéo seront mises à disposition d'un petit groupe de partenaires de confiance au sein de l'API, a indiqué l'entreprise. 

Néanmoins, voici quelques exemples de ce que vous pouvez faire avec le modèle ChatGPT-4o. 

Ce que vous pouvez faire avec GPT-4o

Créer des images avec des textes lisibles

Jusqu'à présent, certains générateurs d'images par IA, comme Midjourney, peinaient encore à créer des images avec du texte lisible. OpenAI a annoncé que GPT-4o comprend désormais beaucoup mieux les descriptions textuelles et peut afficher du texte lisible sur les images. 

Source de l'image : OpenAI

Traduction en temps réel

Dans les situations où un traducteur est nécessaire, GPT-4o peut jouer ce rôle. Lors d'une démonstration vidéo, l'équipe d'OpenAI a montré que GPT-4o pouvait traduire de l'anglais en espagnol, et peut-être dans d'autres langues, puis de l'espagnol vers l'anglais.

Regardez et dites

Pour les personnes malvoyantes, ou simplement par curiosité, ChatGPT-4o peut observer et interpréter l'environnement grâce à la caméra du téléphone. Par exemple, le modèle a pu identifier une fête d'anniversaire en repérant un cake et une bougie dans la pièce.

Résoudre des problèmes mathématiques

GPT-4o peut également analyser des problèmes de mathématiques sur une feuille de papier ou un écran et en fournir la réponse. De plus, il peut vous accompagner et vous guider dans l'apprentissage de la résolution de ces problèmes.

L'IA dans les réunions visuelles

GPT-4o peut participer à des réunions vidéo et dialoguer avec les participants. Il peut également aider les utilisateurs à se préparer aux entretiens d'embauche. 

Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Partagez cet article
PLUS D'ACTUALITÉS
COURS ACCÉLÉRÉ CRYPTOMONNAIES
LES