По слухам, генеральный директор DeepMind, подразделения Google, также осознает трудности, с которыми сталкивается Google в поддержании своего лидирующего положения в разработке видеотехнологий, подобных OpenAI Family, которая демонстрирует значительные успехи на рынке в этой области. Однако этого утверждения уже недостаточно, если обе компании продолжают совершенствоваться в гуманизации видеоконтента, постоянно расширяя границы возможностей ИИ в создании реалистичных видеороликов на основе текстовых подсказок.
Заря видео, созданных с помощью искусственного интеллекта
Компания OpenAI недавно представила Sora, впечатляющий искусственный интеллект, способный автоматически генерировать видеоролики продолжительностью до 60 секунд со сложными сценами, включающими персонажей. В феврале Sora выпустила демонстрационные видеоролики, демонстрирующие расширение Figma, которые быстро стали вирусными, показав возможность создания кадров с полной детализацией и динамикой, а не просто текста на холсте. Такой уровень интеллекта ИИ — это нечто совершенно новое, defiуказывающее на возможность того, что в будущем создание контента с помощью ИИ и цифровое повествование займут свое место рядом с рассказчиками-людьми.
Компания Google разрабатывает многофункциональный генератор текста в видео под названием «Lumiere». Lumiere был представлен в исследовательской работе в январском номере журнала. Lumiere способен генерировать пятисекундные видеоролики, и было бы действительно впечатляюще сказать, что Lumiere на скорости одной минуты способен воспроизвести все действия Соры в сложных минутных видео. Google подчеркнул, что ИИ должен быть безопасным по своей конструкции, что исключает поддержку изменения климата, неправильное использование или создание опасного контента. Это заявление о моральных принципах прозвучало и после того, как Google отложил запуск своего генератора изображений на основе глубокого обучения под названием Gemini, после того как его изображения подверглись критике за сохранение исторических неточностей.
Проблемы данных и этики в разработке ИИ
В проектах Google DeepMind и Open AI решающую роль играют не только качество их моделей ИИ, но и технологические ограничения, а также участие человека. Значительная часть проблемы заключается в сборе данных, необходимых для обучения этих моделей в огромных объемах, и именно это является основой для дальнейшего развития технологий ИИ.
Две компании участвовали в совместном проекте и столкнулись с рядом трудностей в получении данных, которые стали частью неудачной системы обучения для видеороликов на YouTube. Мира Мурати, технический директор OpenAI, в интервью The Wall Street Journal заявила, что характер обучения модели Sora был нечетким. Возможно, модели Sora не хватало функциональности глубокой нейронной сети, которая помогла бы в понимании сложного контента, такого как видеоролик.
Нил Мохан — нынешний генеральный директор YouTube — опроверг эти утверждения, сосредоточившись на правилах, которые, несомненно, будут нарушены этим методом, заявив, что такой подход противоречит условиям использования YouTube. Несмотря на эти предположения, существуют некоторые рекомендации относительно использования видео с YouTube для развития инструмента распознавания речи Whisper, что еще больше усложняет вопросы этичного использования данных в обучении ИИ.
Генерация видео с помощью ИИ с другой точки зрения
Этические вопросы, связанные с использованием данных и злоупотреблением технологиями ИИ, всегда оставались важными для разработчиков ИИ и регулирующих органов. Надежность алгоритмов в оценке преднамеренно неправомерного использования, а также предотвращении злонамеренных действий, представляет собой более широкую тенденцию развития в индустрии ИИ, направленную на повышение ответственности за разработку ИИ. В то же время,tracбыстрого развития интеллектуальных систем, включая Sora от OpenAI, создает сложности в реализации этих моральных кодексов.
Тот факт, что Google DeepMind и OpenAI находятся в конфронтации друг с другом, во многом отражает масштабную конкуренцию между технологическими гигантами в области инноваций в сфере искусственного интеллекта. В то время как OpenAI неплохо справилась с Sora, Google не только создает Lumiere, но и работает над этичной разработкой ИИ, что показывает, что вопрос превосходства в области ИИ далек от завершения. Путь к созданию ИИ, способного создавать все более сложные видеоролики с точки зрения реализма и сложности, делает технологии, этику и креативность гибкими.
В свою очередь, отраслевые исследования будут иметь первостепенное значение, поскольку баланс между инновациями и ответственностью будет иметь решающее значение. Такие компании, как Google DeepMind и Open AI, участвуют не только в соревновании по разработке наиболее инновационных решений в области ИИ, но и в формировании этической парадигмы, которая будет определять будущее мира ИИ. Исход этой гонки, вероятно, определит будущее таких важных элементов, как цифровые медиа, создание контента или роль ИИ в нашей жизни, и внесет коррективы в эти области на долгие годы вперед.

