За два месяца 2024 года конкуренция в сфере искусственного интеллекта между Google и OpenAI обострилась. 15 февраля OpenAI анонсировала Sora, бесспорно, лучший из когда-либо разработанных генераторов видео на основе ИИ. В среду Google представила новый революционный продукт под названием Gemma.
Gemma — это не один продукт, а семейство из двух больших языковых моделей. По словам самой Google, «Gemma — это семейство легковесных, открытых моделей, созданных на основе исследований и технологий, которые Google использовала для создания моделей Gemini»
Согласно объявлению, Gemma в настоящее время доступна разработчикам по всему миру. Модели можно использовать для разработки различных инструментов, таких как чат-боты и практически всего остального, что могут делать модели LLM, но с некоторыми уникальными преимуществами.
Вот некоторые подробности о Джемме, которые вам следует знать.
1. Gemma Open Models
Gemma — это первая крупная модель Google, созданная для открытого сообщества разработчиков и исследователей. Google в основном придерживается подхода закрытого доступа к своим продуктам в области ИИ, включая Gemini, которая является самой продвинутой моделью компании и лежит в основе некоторых ее продуктов, таких как Bard (теперь называемый Gemini).
Закрытый подход Google вызвал критику со стороны сторонников открытого исходного кода, таких как главный научный сотрудник Meta Ян Лекун, который утверждал, что DeepMind, подразделение Google по разработке ИИ, «становится все менее и менее открытым. […] Я думаю, это замедлит прогресс во всей области. Поэтому я не слишком доволен этим»
Как сообщает Forbes со ссылкой на представителя Google Джейн Парк, исходный код или обучающие данные Джеммы не будут доступны для всех в качестве «открытой модели», но «веса» модели, или предварительно обученные параметры, будут предоставлены.
2. Грузики Gemma Model выпускаются в двух размерах
Модель Gemma выпускается в двух весовых вариантах – Gemma 2B и Gemma 7B. Согласно анонсу, каждый размер выпускается с предварительно обученными и настроенными с помощью инструкций вариантами. Параметры представляют собой связи и веса внутри модели, которые позволяют ей улавливать нюансы и взаимосвязи в данных.
Чем больше параметров у модели, тем лучше она может изучать сложные закономерности и выполнять сложные задачи, такие как перевод языков, написание текстов в различных креативных форматах или понимание сложных вопросов.
3. Gemma удобна для работы с ноутбуком
Gemma, несмотря на то, что является мощной языковой моделью, специально разработана для эффективной работы в менее требовательных средах по сравнению с некоторыми другими крупными языковыми моделями. Google заявила, что модель кросс-совместима и может работать на различных устройствах, таких как ноутбуки, настольные компьютеры, устройства IoT, мобильные устройства и облачные сервисы, что обеспечивает широкий доступ к возможностям искусственного интеллекта.
«Предварительно обученные и настроенные с учетом инструкций модели Gemma могут работать на вашем ноутбуке, рабочей станции или в облаке Google с возможностью простого развертывания на платформах Vertex AI и Google Kubernetes Engine (GKE)», — говорится в сообщении.

