ПОСЛЕДНИЕ НОВОСТИ

жить Bitcoin взлетел до 67 000 долларов на фоне мирного соглашения между Трампом и Ираном, которое привело к резкому росту рынков

15 июня 2026 г. — Прямая трансляция.
Binance может быть вынуждена покинуть европейский рынок к 1 июля

2 часа назад Регулирование
Компания SpaceX Маска обогнала Amazon, заключив сделку на 60 миллиардов долларов по приобретению производителя курсоров Anysphere

2 часа назад Технологии
Компания State Street запускает фонд денежного рынка, созданный для резервов стейблкоинов

3 часа назад Новости

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Google DeepMind против OpenAI: гонка в сфере создания видеоконтента с использованием ИИ накаляется

Джон Палмер

3 минуты чтения, 9 апреля 2024 г.

Гонка в сфере видеотехнологий с использованием ИИ накаляется между Google DeepMind и OpenAI
Сложные минутные видеоролики Соры против пятисекундных клипов Люмьера
Вопросы этичного развития ИИ и использования данных подчеркивают конкуренцию

По слухам, генеральный директор DeepMind, подразделения Google, также осознает трудности, с которыми сталкивается Google в поддержании своего лидирующего положения в разработке видеотехнологий, подобных OpenAI Family, которая демонстрирует значительные успехи на рынке в этой области. Однако этого утверждения уже недостаточно, если обе компании продолжают совершенствоваться в гуманизации видеоконтента, постоянно расширяя границы возможностей ИИ в создании реалистичных видеороликов на основе текстовых подсказок.

Заря видео, созданных с помощью искусственного интеллекта

Компания OpenAI недавно представила Sora, впечатляющий искусственный интеллект, способный автоматически генерировать видеоролики продолжительностью до 60 секунд со сложными сценами, включающими персонажей. В феврале Sora выпустила демонстрационные видеоролики, демонстрирующие расширение Figma, которые быстро стали вирусными, показав возможность создания кадров с полной детализацией и динамикой, а не просто текста на холсте. Такой уровень интеллекта ИИ — это нечто совершенно новое, defiуказывающее на возможность того, что в будущем создание контента с помощью ИИ и цифровое повествование займут свое место рядом с рассказчиками-людьми.

Компания Google разрабатывает многофункциональный генератор текста в видео под названием «Lumiere». Lumiere был представлен в исследовательской работе в январском номере журнала. Lumiere способен генерировать пятисекундные видеоролики, и было бы действительно впечатляюще сказать, что Lumiere на скорости одной минуты способен воспроизвести все действия Соры в сложных минутных видео. Google подчеркнул, что ИИ должен быть безопасным по своей конструкции, что исключает поддержку изменения климата, неправильное использование или создание опасного контента. Это заявление о моральных принципах прозвучало и после того, как Google отложил запуск своего генератора изображений на основе глубокого обучения под названием Gemini, после того как его изображения подверглись критике за сохранение исторических неточностей.

Проблемы данных и этики в разработке ИИ

В проектах Google DeepMind и Open AI решающую роль играют не только качество их моделей ИИ, но и технологические ограничения, а также участие человека. Значительная часть проблемы заключается в сборе данных, необходимых для обучения этих моделей в огромных объемах, и именно это является основой для дальнейшего развития технологий ИИ.

Две компании участвовали в совместном проекте и столкнулись с рядом трудностей в получении данных, которые стали частью неудачной системы обучения для видеороликов на YouTube. Мира Мурати, технический директор OpenAI, в интервью The Wall Street Journal заявила, что характер обучения модели Sora был нечетким. Возможно, модели Sora не хватало функциональности глубокой нейронной сети, которая помогла бы в понимании сложного контента, такого как видеоролик.

Нил Мохан — нынешний генеральный директор YouTube — опроверг эти утверждения, сосредоточившись на правилах, которые, несомненно, будут нарушены этим методом, заявив, что такой подход противоречит условиям использования YouTube. Несмотря на эти предположения, существуют некоторые рекомендации относительно использования видео с YouTube для развития инструмента распознавания речи Whisper, что еще больше усложняет вопросы этичного использования данных в обучении ИИ.

Генерация видео с помощью ИИ с другой точки зрения

Этические вопросы, связанные с использованием данных и злоупотреблением технологиями ИИ, всегда оставались важными для разработчиков ИИ и регулирующих органов. Надежность алгоритмов в оценке преднамеренно неправомерного использования, а также предотвращении злонамеренных действий, представляет собой более широкую тенденцию развития в индустрии ИИ, направленную на повышение ответственности за разработку ИИ. В то же время,tracбыстрого развития интеллектуальных систем, включая Sora от OpenAI, создает сложности в реализации этих моральных кодексов.

Тот факт, что Google DeepMind и OpenAI находятся в конфронтации друг с другом, во многом отражает масштабную конкуренцию между технологическими гигантами в области инноваций в сфере искусственного интеллекта. В то время как OpenAI неплохо справилась с Sora, Google не только создает Lumiere, но и работает над этичной разработкой ИИ, что показывает, что вопрос превосходства в области ИИ далек от завершения. Путь к созданию ИИ, способного создавать все более сложные видеоролики с точки зрения реализма и сложности, делает технологии, этику и креативность гибкими.

В свою очередь, отраслевые исследования будут иметь первостепенное значение, поскольку баланс между инновациями и ответственностью будет иметь решающее значение. Такие компании, как Google DeepMind и Open AI, участвуют не только в соревновании по разработке наиболее инновационных решений в области ИИ, но и в формировании этической парадигмы, которая будет определять будущее мира ИИ. Исход этой гонки, вероятно, определит будущее таких важных элементов, как цифровые медиа, создание контента или роль ИИ в нашей жизни, и внесет коррективы в эти области на долгие годы вперед.

Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Джон Палмер

Джон Мурангири пришел в Cryptopolitan обладая навыками анализа рынка. Джон (он же JP) окончил Университет Найроби со степенью бакалавра в области массовых коммуникаций и медиаисследований. Ранее он публиковал аналитические материалы о криптовалютном рынке на InsideBitcoins.com и Metacoingraph.

ОГЛАВЛЕНИЕ

1. Заря видео, созданных с помощью искусственного интеллекта

2. Проблемы данных и этики в разработке ИИ

3. Генерация видео с помощью ИИ с другой точки зрения

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)