La competencia en IA entre Google y OpenAI se ha intensificado a tan solo dos meses de 2024. El 15 de febrero, OpenAI anunció Sora, sin duda el mejor generador de vídeo con IA jamás desarrollado. El miércoles, Google presentó un nuevo producto innovador llamado Gemma.
En realidad, Gemma no es un producto único, sino una familia de dos grandes modelos de lenguaje. En palabras de Google: «Gemma es una familia de modelos ligeros y abiertos, creados a partir de la investigación y la tecnología que Google utilizó para crear los modelos Gemini»
Según el anuncio, Gemma ya está disponible para desarrolladores de todo el mundo. Los modelos pueden utilizarse para desarrollar diversas herramientas, como chatbots y prácticamente todo lo que un LLM puede hacer, pero con ventajas únicas.
Aquí te contamos algunos detalles que debes saber sobre Gemma.
1. Modelos abiertos de Gemma
Gemma es el primer modelo importante de Google diseñado para la comunidad abierta de desarrolladores e investigadores. Google ha mantenido principalmente un enfoque de acceso cerrado con sus productos de IA, incluyendo Gemini, el modelo más avanzado de la compañía que impulsa algunos de sus productos como Bard (ahora llamado Gemini).
El enfoque cerrado de Google ha generado críticas de defensores del código abierto, como el científico jefe de Meta, Yann LeCun, quien argumentó que DeepMind, la división de desarrollo de IA de Google, se está volviendo cada vez menos abierta. […] Creo que esto ralentizará el progreso en todo el campo. Así que no estoy muy contento con esto
No es que el código fuente real de Gemma o los datos de entrenamiento estarán disponibles para que la gente pueda acceder a ellos como un "modelo abierto", pero los "pesos" del modelo, o parámetros entrenados previamente, estarán disponibles, informó Forbes, citando a la portavoz de Google, Jane Park.
2. Las pesas modelo Gemma vienen en dos tamaños
Gemma está disponible en dos versiones de peso: Gemma 2B y Gemma 7B. Según el anuncio, cada tamaño se lanza con variantes preentrenadas y optimizadas según las instrucciones. Los parámetros representan las conexiones y pesos dentro del modelo, lo que permite capturar matices y relaciones en los datos.
Cuanto mayor sea el número de parámetros que tenga un modelo, mejor podrá aprender patrones complejos y realizar tareas complejas, como traducir idiomas, escribir diferentes tipos de formatos de texto creativos o comprender preguntas complejas.
3. Gemma es compatible con portátiles
Gemma, si bien es un modelo de lenguaje potente, está diseñado específicamente para ser eficiente y ejecutarse en entornos menos exigentes en comparación con otros modelos de lenguaje de gran tamaño. Google afirmó que el modelo es compatible con múltiples dispositivos, como portátiles, ordenadores de sobremesa, IoT, móviles y la nube, lo que permite un amplio acceso a las capacidades de IA.
“Los modelos Gemma previamente entrenados y ajustados según instrucciones pueden ejecutarse en su computadora portátil, estación de trabajo o Google Cloud con una implementación sencilla en Vertex AI y Google Kubernetes Engine (GKE)”, se lee en el anuncio.

