La competizione tra Google e OpenAI nel campo dell'intelligenza artificiale si è intensificata a soli due mesi dall'inizio del 2024. Il 15 febbraio, OpenAI ha annunciato Sora, che è indiscutibilmente il miglior generatore di video basato su intelligenza artificiale mai sviluppato. Mercoledì, Google ha lanciato un nuovo prodotto rivoluzionario chiamato Gemma.
Gemma in realtà non è un singolo prodotto, ma piuttosto una famiglia di due grandi modelli linguistici. Come afferma Google, "Gemma è una famiglia di modelli leggeri e aperti, basati sulla ricerca e sulla tecnologia che Google ha utilizzato per creare i modelli Gemini"
Secondo l'annuncio, Gemma è attualmente disponibile per gli sviluppatori di tutto il mondo. I modelli possono essere utilizzati per sviluppare diversi strumenti, come chatbot e praticamente tutto ciò che gli LLM possono fare, ma con alcuni vantaggi unici.
Ecco alcuni dettagli da sapere su Gemma.
1. Modelli aperti Gemma
Gemma è il primo modello importante di Google pensato per la comunità aperta di sviluppatori e ricercatori. Google ha mantenuto un approccio ad accesso chiuso per i suoi prodotti di intelligenza artificiale, incluso Gemini, il modello più avanzato dell'azienda, che alimenta alcuni dei suoi prodotti come Bard (ora chiamato Gemini).
L'approccio chiuso di Google ha attirato critiche da parte di sostenitori dell'open source come Yann LeCun, capo scienziato di Meta, il quale ha sostenuto che DeepMind, la divisione di sviluppo dell'intelligenza artificiale di Google, sta "diventando sempre meno aperta. […] Penso che rallenterà il progresso nell'intero settore. Quindi non ne sono molto contento"
Non che il codice sorgente effettivo o i dati di addestramento di Gemma saranno accessibili alle persone come "modello aperto", ma i "pesi" del modello, ovvero i parametri pre-addestrati, saranno resi disponibili, ha riportato Forbes, citando la portavoce di Google Jane Park.
2. I pesi modello Gemma sono disponibili in due misure
Gemma è disponibile in due versioni di peso: Gemma 2B e Gemma 7B. Secondo l'annuncio, ogni dimensione viene rilasciata con varianti pre-addestrate e ottimizzate in base alle istruzioni. I parametri rappresentano le connessioni e i pesi all'interno del modello che consentono di catturare sfumature e relazioni nei dati.
Quanto più alto è il numero di parametri di un modello, tanto meglio può apprendere modelli complessi ed eseguire attività complesse, come tradurre lingue, scrivere diversi tipi di formati di testo creativi o comprendere domande complesse.
3. Gemma è adatta ai laptop
Gemma, pur essendo un modello linguistico potente, è specificamente progettato per essere efficiente e funzionare in ambienti meno esigenti rispetto ad altri modelli linguistici di grandi dimensioni. Google ha affermato che il modello è cross-compatibile e può essere eseguito su più dispositivi come laptop, desktop, IoT, dispositivi mobili e cloud, consentendo funzionalità di intelligenza artificiale ampiamente accessibili.
"I modelli Gemma pre-addestrati e ottimizzati in base alle istruzioni possono essere eseguiti sul tuo laptop, sulla tua workstation o su Google Cloud con una facile distribuzione su Vertex AI e Google Kubernetes Engine (GKE)", si legge nell'annuncio.

