Марк Цукерберг возвращает Meta в борьбу с ИИ с помощью Mango, новой модели для работы с изображениями и видео, которая дополняет следующую текстовую модель Meta, Avocado. Все они созданы для конкуренции с новыми инструментами Google Gemini и системами обработки изображений OpenAI.
По словам Александра Вана, директора компании по искусственному интеллекту, в ходе внутренней сессии вопросов и ответов с Крисом Коксом, Meta планирует внедрить обе модели в первой половине 2026 года.
Александр также сообщил, что компания Meta начинает работу над моделями раннего мира, то есть над системами искусственного интеллекта, которые обучаются, получая визуальные данные из окружающей среды.
Летом компания Meta полностью изменила свою структуру в области искусственного интеллекта. Она наняла Александра для руководства подразделением под названием Meta Superintelligence Labs. Затем Цукерберг начал активный набор персонала и переманил более двадцати исследователей из OpenAI.
Он собрал команду из более чем пятидесяти человек с глубокими знаниями в области искусственного интеллекта. Компания Meta пытается привлечь как можно больше специалистов, поскольку генерация изображений сейчас является одним из главных полей битвы между крупными компаниями, занимающимися моделированием.
Модели Google и OpenAI будут представлять собой серьёзную конкуренцию.
В сентябре компания Meta выпустила генератор видео под названием Vibes. Инструмент был создан с использованием платформы Midjourney. Несколько дней спустя OpenAI выпустила свой собственный продукт, Sora, чтобы не отставать. Эта перепалка показала, насколько быстро реагирует каждая компания.
Ранее в этом году Google уже запустила новую волну с помощью Nano Banana, которая увеличила число ежемесячных пользователей Gemini с 450 миллионов в июле до более чем 650 миллионов к концу октября. Этот скачок оказал еще большее давление на других игроков.
Напряжение вновь возросло в ноябре, когда Google выпустила третью версию Gemini. Сразу после этого, по словам сотрудников OpenAI, Сэм Альтман объявил «красный код», чтобы подтолкнуть компанию к возвращению лидирующих позиций в тестах моделей. Затем OpenAI выпустила новую версию ChatGPT Images.
Позже Сэм встретился с журналистами и заявил, что создание изображений теперь является одной из главных причин, по которой пользователи возвращаются к приложениям с искусственным интеллектом, назвав это «привлекательной» функцией. Послание было ясным: борьба за изображения не прекращается.
В среду Google анонсировала Gemini 3 Flash. Эта модель создана для более быстрой и экономичной работы, и предназначена для широкого круга пользователей. Она обладает многими функциями логического мышления, присущими Gemini 3 Pro, но в более компактном корпусе.
Весь план прост. Вместо того чтобы держать лучшие инструменты в рамках корпоративных тарифных планов, Google хочет внедрить эти модели в приложения для массового рынка.
Генеральный директор Alphabet Сундар Пичаи заявил: «С этим релизом интеллектуальные возможности нового поколения Gemini 3 теперь становятся доступны всем пользователям наших продуктов, включая приложение Gemini и режим ИИ в поиске. Разработчики могут использовать его в Gemini API, Google AI Studio, Gemini CLI и Google Antigravity, а предприятия — в Vertex AI и Gemini Enterprise».

