La compétition en intelligence artificielle entre Google et OpenAI s'est intensifiée en ce début d'année 2024. Le 15 février, OpenAI a annoncé Sora, sans conteste le meilleur générateur vidéo IA jamais conçu. Mercredi, Google a dévoilé Gemma, un nouveau produit révolutionnaire.
Gemma n'est pas un produit unique, mais plutôt une famille de deux grands modèles de langage. Selon Google, « Gemma est une famille de modèles légers et ouverts, construits à partir des recherches et des technologies utilisées par Google pour créer les modèles Gemini. »
D'après l'annonce, Gemma est actuellement disponible pour les développeurs du monde entier. Les modèles peuvent être utilisés pour développer différents outils, comme des chatbots, et pratiquement tout ce que les LLM peuvent faire, avec toutefois des avantages uniques.
Voici quelques détails à savoir sur Gemma.
1. Modèles ouverts Gemma
Gemma est le premier modèle majeur de Google conçu pour la communauté ouverte des développeurs et des chercheurs. Google a majoritairement privilégié une approche à accès fermé pour ses produits d'IA, notamment Gemini, son modèle le plus avancé qui alimente certains de ses produits comme Bard (désormais appelé Gemini).
L'approche fermée de Google a suscité des critiques de la part de défenseurs de l'open source comme Yann LeCun, directeur scientifique de Meta, qui a affirmé que DeepMind, la division de développement d'IA de Google, « devient de moins en moins ouverte. […] Je pense que cela va ralentir les progrès dans tout le domaine. Je ne suis donc pas très content de cela. »
Selon Forbes, citant Jane Park, porte-parole de Google, le code source ou les données d'entraînement de Gemma ne seront pas accessibles au public en tant que « modèle ouvert », mais les « poids » ou paramètres pré-entraînés du modèle seront mis à disposition.
2. Les poids pour mannequin Gemma sont disponibles en deux tailles
Gemma se décline en deux versions : Gemma 2B et Gemma 7B. Chaque version est disponible avec des variantes pré-entraînées et optimisées. Les paramètres représentent les connexions et les pondérations du modèle, lui permettant ainsi de saisir les nuances et les relations présentes dans les données.
Plus un modèle possède de paramètres, mieux il peut apprendre des schémas complexes et effectuer des tâches complexes, comme la traduction de langues, la rédaction de différents types de textes créatifs ou la compréhension de questions complexes.
3. Gemma est compatible avec les ordinateurs portables
Gemma, bien qu'étant un modèle de langage puissant, est spécifiquement conçu pour être efficace et fonctionner dans des environnements moins exigeants que certains autres grands modèles de langage. Google a indiqué que ce modèle est multiplateforme et peut s'exécuter sur de nombreux appareils tels que les ordinateurs portables, les ordinateurs de bureau, les objets connectés, les appareils mobiles et le cloud, permettant ainsi un accès plus large aux capacités d'IA.
« Les modèles Gemma pré-entraînés et optimisés peuvent être exécutés sur votre ordinateur portable, votre poste de travail ou Google Cloud grâce à un déploiement facile sur Vertex AI et Google Kubernetes Engine (GKE) », indique le communiqué.

