ПОСЛЕДНИЕ НОВОСТИ

жить В прямом эфире: Федеральная резервная система сохранила процентные ставки без изменений на первом заседании Кевина Уорша

17 июня 2026 г. — Прямая трансляция.
4 минуты назад Новости
Эндрю Тейт потерял более 95 000 долларов на сделках Bitcoin и Hyperliquid после 8 ликвидаций за 24 часа

20 минут назад Новости
В Омане создан национальный пул для майнинга bitcoin , обязывающий всех лицензированных майнеров направлять хешрейт через OmanHash

60 минут назад Новости

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Технология VASA-1 от Microsoft способна создавать реалистичные говорящие лица всего из одного изображения

Аамир Шейх

3 минуты чтения, 19 апреля 2024 г.

В исследовательской статье Microsoft представлен исследовательский проект по созданию говорящих голов.
Новая модель искусственного интеллекта может сгенерировать говорящее лицо или голову, загрузив одну фотографию и голосовую заметку.
Анимированное лицо имеет реалистичную мимику и движения губ, что позволяет сочетать голос с реальными движениями головы.

В недавнем техническом документе Microsoft представила новую модель искусственного интеллекта, которая создает говорящую голову, выглядящую и звучащую реалистично. Для ее создания достаточно загрузить неподвижную фотографию и образец голоса.

Новая модель получила название VASA-1. Для её работы достаточно одного портретного изображения и аудиофайла с голосом, после чего она объединяет их в короткое видео говорящей головы с мимикой, синхронизацией губ и движениями головы. Полученная голова даже может петь песни, причём голосом, загруженным в процессе создания.

Microsoft VASA-1 — это прорыв в области анимации

По данным Microsoft, новая модель искусственного интеллекта всё ещё находится на стадии исследований, и пока нет планов её выпуска для широкой публики, а доступ к ней имеют только исследователи Microsoft. Тем не менее, компания поделилась несколькими демонстрационными примерами, которые демонстрируют потрясающий реализм и движения губ, кажущиеся слишком реалистичными.

В демо-версии люди выглядят настоящими, как будто сидят перед камерой и их снимают. Движения голов реалистичны и выглядят вполне естественно, а движение губ, синхронизированное со звуком, просто великолепное, хотя, кажется, нет ничего, что могло бы показаться неестественным. Общая синхронизация движений губ феноменальна.

Microsoft заявила, что модель была разработана для анимации виртуальных персонажей, и заявила, что все люди, показанные в демонстрации, являются синтетическими. По её словам, модели были созданы с помощью DALL-E, генератора изображений OpenAI. Поэтому мы считаем, что если модель может анимировать модель, созданную ИИ, то, очевидно, у неё есть гораздо больший потенциал для анимации фотографий любого реального человека, что должно быть более реалистично и гораздо проще для обработки.

Варианты использования Vasa-1 и его потенциальное нецелевое использование

Если рассматривать потенциал VASA-1 для практического применения, то, по сути, он может быть использован для анимации персонажей в анимационных фильмах, что придаст им более реалистичный вид благодаря естественной мимике и движениям головы. Другим вариантом применения может стать видеоигра, по той же причине, например, Grand Theft Auto и подобные игры. В будущем он может быть использован для создания гиперреалистичных фильмов и сериалов, создаваемых искусственным интеллектом, где персонажи могут быть сгенерированы генераторами изображений и анимированы с помощью VASA-1, и зрители могут даже не почувствовать, что это не люди.

Помимо творческого использования инструмента, его также можно использовать для создания вредоносного контента. Потенциальным злоупотреблением VASA-1 может стать его применение для создания дипфейков, поскольку это позволит любому, кто занимается созданием дипфейков, масштабировать свои злонамеренные тактики и создавать более реалистичный, вводящий в заблуждение контент. Помните скандал с робозвонком, в котором голос Байдена был использован для того, чтобы удержать людей от голосования перед праймериз? Теперь после робозвонка может появиться робовидео, причём с очень реалистичными человеческими выражениями.

Потенциальный риск ненадлежащего использования может быть причиной того, что Microsoft ограничила тестирование только своими исследователями. По мнению Microsoft , этот инструмент может быть использован для создания вводящего в заблуждение и обманного контента, выдающего себя за людей, как и некоторые другие инструменты, но они нацелены на позитивное использование. Nvidia и Runway AI также выпустили свои модели для той же функции, но VASA-1 представляется гораздо более реалистичным и перспективным кандидатом.

Самые умные криптоаналитики уже читают нашу рассылку. Хотите присоединиться? Вступайте в их ряды.

Поделитесь этой статьей

Предупреждение: Предоставленная информация не является торговой рекомендацией. Cryptopolitanне несет ответственности за любые инвестиции, совершенные на основе информации, представленной на этой странице. Мыtronрекомендуем провести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Аамир Шейх

Аамир — технологический журналист с почти шестилетним опытом работы в крипто- и технологической индустриях. Он окончил университет MAJ со степенью MBA в области финансов и маркетинга. Сейчас он работает в Cryptopolitan, где освещает последние события на криптовалютных рынках и прогнозирует цены.

ОГЛАВЛЕНИЕ

1. Microsoft VASA-1 — это прорыв в области анимации

2. Варианты использования Vasa-1 и его потенциальное нецелевое использование

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)