DERNIÈRES NOUVELLES

en direct EN DIRECT : La Réserve fédérale maintient ses taux d'intérêt inchangés lors de la première réunion de Kevin Warsh

Mises à jour en direct du 17 juin 2026
Actualités d'il y a 4 minutes
Andrew Tate perd plus de 95 000 $ en transactions Bitcoin et Hyperliquid après 8 liquidations en 24 heures

Actualités d'il y a 20 minutes
Oman impose un pool national de minage bitcoin , obligeant tous les mineurs agréés à acheminer leur puissance de hachage via OmanHash

Actualités d'il y a 60 minutes

SÉLECTIONNÉ POUR VOUS

HEBDOMADAIRE

RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Le VASA-1 de Microsoft peut générer des visages parlants réalistes à partir d'une seule image

Par

Aamir Sheikh

3 minutes de lecture 19 avril 2024

Un document de recherche de Microsoft a présenté un projet de recherche visant à générer des têtes parlantes.
Le nouveau modèle d'IA peut générer un visage ou une tête parlante à partir d'une simple photo et d'un enregistrement vocal.
Le visage animé possède des expressions faciales et des mouvements des lèvres réalistes qui correspondent à la voix et aux mouvements de tête réels.

Dans un récent livre blanc, Microsoft a présenté un nouveau modèle d'IA qui produit une tête parlante d'apparence et de son réalistes, générée uniquement à partir d'une photographie fixe et d'un échantillon vocal.

Le nouveau modèle, baptisé VASA-1, ne nécessite qu'une photo portrait et un fichier audio pour créer une courte vidéo d'une tête parlante. Cette tête animée possède des expressions faciales, une synchronisation labiale et des mouvements de tête. Elle peut même chanter, avec la voix enregistrée lors de sa création.

Microsoft VASA-1 représente une avancée majeure dans le domaine de l'animation.

D'après Microsoft, le nouveau modèle d'IA est encore en phase de recherche et aucune diffusion publique n'est prévue pour le moment ; seuls les chercheurs de Microsoft y ont accès. L'entreprise a toutefois partagé plusieurs exemples de démonstrations, révélant un réalisme saisissant et des mouvements des lèvres d'un naturel troublant.

La démo montre des personnes d'un réalisme saisissant, comme si elles étaient assises devant une caméra et filmées. Les mouvements de la tête sont réalistes et paraissent très naturels, et la synchronisation labiale avec le son est remarquable, au point qu'il est difficile de déceler un quelconque manque de naturel. La synchronisation labiale globale est phénoménale.

Microsoft a déclaré que le modèle avait été développé pour animer des personnages virtuels et a affirmé que toutes les personnes présentées dans la démo étaient synthétiques. En effet, selon l'entreprise, les modèles ont été générés par DALL-E, le générateur d'images d'OpenAI. Par conséquent, si ce modèle peut animer un modèle généré par IA, son potentiel est évidemment bien plus important pour animer des photos de personnes réelles, ce qui serait plus réaliste et beaucoup plus simple à gérer.

Cas d'utilisation de Vasa-1 et ses mésusages potentiels

Si l'on considère le potentiel de VASA-1 pour des applications pratiques, il peut, dans un premier temps, servir à animer des personnages de films d'animation, leur conférant un aspect plus réaliste grâce à des expressions faciales et des mouvements de tête naturels. Il pourrait également être utilisé dans les jeux vidéo, pour la même raison, comme Grand Theft Auto. À l'avenir, il pourrait servir à la création de films ou de séries hyperréalistes générés par IA, où les personnages, créés à partir d'images, seraient animés par VASA-1, au point que le public pourrait ne pas se rendre compte qu'il ne s'agit pas de personnages humains.

Outre son utilisation créative, cet outil peut également servir à créer du contenu à des fins malveillantes. L'utilisation abusive potentielle de VASA-1 pourrait résider dans son exploitation pour la création de deepfakes, car elle permettrait à quiconque impliqué dans ce domaine d'amplifier ses pratiques malhonnêtes et de générer un contenu trompeur encore plus réaliste. Vous souvenez-vous du scandale des appels automatisés utilisant la voix de Biden pour dissuader les électeurs de voter avant une primaire ? Imaginez maintenant une vidéo automatisée faisant suite à cet appel, avec des expressions humaines d'un réalisme saisissant.

Le risque potentiel d'utilisation abusive explique peut-être pourquoi Microsoft a limité ses tests à ses seuls chercheurs. Selon ces derniers, l'outil peut servir à créer du contenu trompeur et mensonger, voire à usurper l'identité d'humains, comme d'autres outilssimilaires, mais Microsoft privilégie des applications à vocation positive. Nvidia et Runway AI ont également publié leurs modèles pour cette même fonction, mais VASA-1 semble bien plus réaliste et prometteur.

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les !

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. Cryptopolitandécline toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Aamir Sheikh

Aamir est un journaliste spécialisé dans les technologies, fort de près de six ans d'expérience dans les secteurs des cryptomonnaies et des technologies. Diplômé de l'université MAJ avec un MBA en finance et marketing, il travaille actuellement pour Cryptopolitan, où il couvre l'actualité des marchés des cryptomonnaies et propose des prévisions de prix.

TABLE DES MATIÈRES

1. Microsoft VASA-1 représente une avancée majeure dans le domaine de l'animation.

2. Cas d'utilisation de Vasa-1 et ses mésusages potentiels

Partagez cet article

PLUS D'ACTUALITÉS

AFFICHER TOUT

5 applications ingénieuses de ChatGPT et ce que vous devriez en faire

Il y a 3 ans, John Palmer, technicien

93 % des dirigeants d'entreprise privilégient les solutions basées sur l'IA pour la gestion de la durabilité de leur marque (Reuters)

Il y a 3 ans, John Palmer, technicien

Voici comment Macron soutient l'écosystème d'IA dynamique et productif de la France

Il y a 3 ans, Tech Glory Kaburu

Bloomberg estime que le marché de l'IA générative atteindra 1 300 milliards de dollars d'ici 2032

Il y a 3 ans, Tech Aamir Sheikh

Base est-il le réseau Ethereum de couche 2 lancé par Coinbase ?

21 octobre 2025 Apprendre la crypto : Guides pour débutants
Dogecoin contre Bitcoin: Principales différences techniques

20 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce que la TVL (Total Value Locked) en cryptomonnaie ?

14 octobre 2025 Apprendre la crypto : Guides pour débutants
Comment lire un livre blanc sur les cryptomonnaies ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Ripple vs. XRP vs. XRP Ledger : quelle est la différence ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce qu'un portefeuille multisignature dans le monde des cryptomonnaies ?

10 octobre 2025 Apprendre la crypto : Guides pour débutants

COURS ACCÉLÉRÉ SUR LES CRYPTOMONNAIES

Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
Stratégies d'investissement peu connues utilisées par les professionnels
Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)