В среду поисковый гигант Google запустил Gemini 2.0, экспериментальную модель, которая может использовать веб-сайты самостоятельно и, по сути, является моделью «для всего»
По словам генерального директора Google Сундара Пичаи, новейшая модель позволит пользователям создавать новых агентов искусственного интеллекта, которые «приблизят нас к нашей концепции универсального помощника». Компания охарактеризовала свою модель как самую «способную модель, когда-либо созданную для эры агентов».
Эти инициативы являются частью усилий компании в условиях усиления конкуренции в технологической отрасли со стороны таких компаний, как Meta, Microsoft и Meta.
Google внедрит эту модель во все свои продукты
Пичай также представил новейшую модель с многомодальными возможностями, которые будут внедрены во все продукты компании, включая собственный вывод изображений и аудио. Поисковый гигант запустил Gemini 1.0 в декабре прошлого года, которую Google назвала первой «собственно многомодальной» моделью, предполагающей, что модель может обрабатывать и отвечать на запросы текста, видео, изображений, аудио и кода.
Последняя версия представляет собой новейшие разработки Google в условиях все более жесткой конкуренции в сфере искусственного интеллекта.
«Если Gemini 1.0 был посвящен организации и пониманию информации, то Gemini 2.0 — тому, как сделать ее гораздо более полезной»
Пичай.
Выпуск Gemini 2.0 состоялся почти через 10 месяцев после того, как Google впервые представила версию 1.5. По данным Google, модель все еще находится на стадии экспериментального предварительного просмотра, и выпущена только одна версия — более компактная и бюджетная 2.0 Flash.
Генеральный директор Google DeepMind и руководитель направления искусственного интеллекта компании Демис Хассабис заявил, что это все равно важный день для технологического гиганта.
«Она ничем не уступает текущей модели Pro. Поэтому её можно рассматривать как модель на целый уровень лучше, при этом сохраняя ту же экономическую эффективность, производительность и скорость. Мы очень довольны этим», — пояснил Хассабис.
В настоящее время только разработчики и тестировщики первыми получают версию 2.0, в то время как другие пользователи Gemini имеют доступ к экспериментальной модели Flash 2.0, которая основана на Flash 1.5, выпущенной как самая быстрая и экономичная модель.
Google анонсировала ряд новых функций
По словам Пичаи, компания планирует добавить возможности логического мышления новой модели в функцию «Обзоры ИИ», которая в настоящее время доступна миллиарду пользователей. Он отметил, что эта функция становится одной из самых популярных в группе.
Пичай также подчеркнул, что благодаря этой новой модели AI Overviews теперь сможет обрабатывать сложные многошаговые запросы, например,maticуравнения и многомодальные вопросы.
Хотя ограниченное тестирование новейшей модели началось на этой неделе, функция анализа причин станет доступна большему числу пользователей только в начале следующего года.
По данным Google, модель обработки информации работает на базе чипа Trillium 6- го поколения, предназначенного для искусственного интеллекта, который также стал доступен клиентам Google Cloud в среду.
В своем блоге Google сообщила, что новый чип обеспечивает в 4 раза более высокую производительность и на 67% более энергоэффективен, чем его предшественник.
Мы начинаем эру Gemini 2.0 с Gemini 2.0 Flash, который превосходит 1.5 Pro по ключевым показателям производительности в 2 раза (см. диаграмму ниже). Особенно рад видеть быстрый прогресс в программировании, и это еще не все.
Разработчики могут опробовать экспериментальную версию в области ИИ… pic.twitter.com/iEAV8dzkaW
– Сундар Пичаи (@sundarpichai) 11 декабря 2024 г.
Генеральный директор Google также анонсировал другие функции, такие как новая функция Gemini под названием Deep Research, которая может выступать в качестве помощника в исследованиях, используя расширенные возможности логического мышления и анализа длительной контекстной информации. Эта новая функция доступна в Gemini Advanced и способна составлять исследовательские отчеты от имени пользователя.
Хассабис заявил, что Gemini 2.0 закладывает основу для прекрасного 2025 года.
«Мы действительно рассматриваем 2025 год как настоящий старт эры агентской деятельности»
Хассабис.
Это произошло одновременно с объявлением компанией о запуске еще одного продукта, Project Mariner , экспериментального расширения для Chrome, которое может буквально использовать веб-браузер в интересах пользователей.
Кроме того, Google также анонсировала Jules — агента, созданного специально для помощи разработчикам в поиске и исправлении некорректного кода, — и нового агента на базе Gemini 2.0, который может анализировать экраны пользователей и помогать им лучше играть в видеоигры.
По словам Хассабиса, игровой агент, которого он называет «пасхальным яйцом», указывает на то, что игра действительно мультимодальна.

