FREE REPORT: A New Way to Earn Passive Income in 2025 DOWNLOAD

Google DeepMind разрабатывает V2A, который создает звук для видео с искусственным интеллектом

В этом посте:

  • Инструмент V2A можно использовать для создания неограниченного количества звуковыхtracдля любого видеовыхода.
  • DeepMind не торопится, чтобы опубликовать V2A, поскольку инструмент проходит строгие оценки безопасности.
  • V2A совместим с такими инструментами создания видео, как Veo, иmaticподбирает звуки к соответствующим сценам.

DeepMind, исследовательская лаборатория искусственного интеллекта Google, сообщила, что работает над инструментом искусственного интеллекта, известным как V2A, который может создавать звук и диалоги для видео, созданных искусственным интеллектом. V2A, что означает «видео в аудио», использует текстовые подсказки и видеопиксели для создания диалогов, музыки и звуковых эффектов для видео.

Читайте также: Google DeepMind представляет TacticAI: революция в футбольных тактиках

По данным DeepMind, созданные звуковые эффекты и музыка соответствуют предполагаемому тону и персонажам видео. DeepMind далее пояснил, что эта технология может помочь оживить видео, созданное искусственным интеллектом.

V2A сопоставляет аудио с видеосценами

Хотя в технологии генерации звука нет ничего нового, DeepMind утверждает, что ее инструмент V2A является первым в своем роде, которыйmaticсопоставляет аудио с видео.

«Модели генерации видео развиваются невероятными темпами, но многие современные системы могут генерировать только тихий вывод», — написал DeepMind в своем блоге .

«Благодаря обучению видео, аудио и дополнительным аннотациям наша технология учится связывать определенные аудиособытия с различными визуальными сценами, реагируя при этом на информацию, представленную в аннотациях или расшифровках».

ДипМайнд.

Компания добавила, что ее технология является автоматической matic в отличие от трудоемкой ручной настройки, требующей настройки звука, видео и тайминга.

По данным DeepMind, инструмент V2A можно использовать для создания неограниченного количества звуковыхtracдля любого видеовыхода. Положительная подсказка может быть «defiтак, чтобы направлять генерируемый результат в сторону желаемых звуков, или отрицательная подсказка, чтобы отклонять ее от нежелательных звуков».

См. Также  300 тыс. Заказов за 1 час - Сваи Xiaomi на китайском электромобиле Tesla борется с запуском Yu7

«Эта гибкость дает пользователям больше контроля над выходом V2A, позволяя быстро экспериментировать с различными аудиовыходами и выбирать наиболее подходящий», — заявили в компании.

Deepmind не тронут конкуренцией

Последняя инновация появилась, когда DeepMind хочет укрепить свое доминирование в отрасли. Ранее в этом году британская компания ElevenLabs, занимающаяся созданием голосовых генераторов искусственного интеллекта, достигла важной вехи после того, как ее раунд финансирования серии B принес 80 миллионов долларов, что позволило оценить компанию более чем в 1 миллиард долларов, согласно данным Verdict .

Компания заявляет, что ее пользователи создали аудио за более чем 100 лет. Компания также утверждает, что ее аудиопрограммное обеспечение в настоящее время используется 41% компаний из списка Fortune 500.

Читайте также: Google DeepMind против OpenAI: гонка в создании видео с использованием искусственного интеллекта набирает обороты

Несмотря на эту конкуренцию, DeepMind заявила, что не торопится публиковать технологию.

«Прежде чем мы рассмотрим возможность открытия доступа для широкой публики, наша технология V2A пройдет строгую оценку и тестирование безопасности», — заявили в компании.

DeepMind также отметила, что V2A совместима с моделями генерации видео, такими как Veo , что помогает создавать реалистичные звуковые эффекты.

См. Также  Трамп, чтобы выпустить исполнительные приказы победить Китай в Global Tech Arms Race

Криптополитический репортаж Энаси Мапакаме

Криптополитическая академия: устал от рыночных колебаний? Узнайте, как DeFi может помочь вам получить стабильный пассивный доход. Зарегистрироваться сейчас

Поделиться ссылкой:

Отказ от ответственности. Предоставленная информация не является торговым советом. Cryptopolitan.com не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мы tron рекомендуем провести dent исследование и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Самые читаемые

Загрузка самых читаемых статей...

Будьте в курсе новостей криптовалюты, получайте ежедневные обновления на свой почтовый ящик.

Выбор редактора

Загрузка статей "Выбор редакции"...

- Крипто -информационный бюллетень, который держит вас вперед -

Рынки движутся быстро.

Мы двигаемся быстрее.

Подпишитесь на Cryptopolitan Daily и получайте своевременную, острую и соответствующую криптографию прямо к вашему почтовым ящику.

Присоединяйтесь сейчас и
никогда не пропустите ход.

Войти. Получите факты.
Продвинуться вперед.

Подпишитесь на КриптоПолитан