Mercoledì il colosso dei motori di ricerca Google ha lanciato Gemini 2.0, un modello sperimentale in grado di utilizzare autonomamente i siti web e che rappresenta fondamentalmente un modello "per tutto"
Secondo il CEO di Google Sundar Pichai, l'ultimo modello consentirà agli utenti di creare nuovi agenti di intelligenza artificiale che "ci avvicineranno alla nostra visione di un assistente universale". L'azienda ha descritto il suo modello come il più "efficiente mai realizzato per l'era dell'agente".
Le iniziative rientrano negli sforzi dell'azienda per contrastare la crescente concorrenza nel settore tecnologico con aziende come Meta, Microsoft e Meta.
Google estenderà il modello a tutti i prodotti
Pichai ha anche annunciato che l'ultimo modello, con funzionalità multimodali, sarà implementato nei suoi prodotti, tra cui output nativo di immagini e audio. Il colosso dei motori di ricerca ha lanciato Gemini 1.0 a dicembre dello scorso anno, che Google ha definito il primo modello "nativamente multimodale", suggerendo che potrebbe elaborare e rispondere a richieste di testo, video, immagini, audio e codice.
L'ultima versione rappresenta gli ultimi sforzi di Google nella corsa sempre più competitiva dell'intelligenza artificiale nel settore tecnologico.
"Se Gemini 1.0 si occupava di organizzare e comprendere le informazioni, Gemini 2.0 si propone di renderle molto più utili."
Pichai.
Gemini 2.0 arriva quasi 10 mesi dopo il lancio della versione 1.5 da parte di Google. Secondo Google, il modello è ancora in fase di anteprima sperimentale, con una sola versione rilasciata, la 2.0 Flash, più piccola e di fascia bassa.
Demis Hassabis, CEO di Google DeepMind e responsabile degli sforzi dell'azienda nel campo dell'intelligenza artificiale, ha affermato che questo è comunque un giorno importante per il gigante della tecnologia.
"È valido quanto l'attuale modello Pro. Quindi si può considerare un livello superiore, con la stessa efficienza in termini di costi, prestazioni e velocità. Ne siamo davvero soddisfatti", ha spiegato Hassabis.
Attualmente, solo gli sviluppatori e i tester sono i primi a ricevere la versione 2.0, mentre gli altri utenti Gemini hanno accesso al modello sperimentale Flash 2.0, che si basa sulla versione 1.5 Flash, lanciata come il modello più veloce e conveniente.
Google ha annunciato una serie di nuove funzionalità
L'azienda prevede di aggiungere le capacità di ragionamento del nuovo modello alla funzionalità "Panoramiche AI", ora accessibile a un miliardo di utenti, secondo Pichai. Pichai ha affermato che sta diventando una delle funzionalità di ricerca più popolari del gruppo.
Con questo nuovo modello, Pichai ha ulteriormente sottolineato che le panoramiche AI saranno ora in grado di affrontare complesse query multi-step, ad esempio equazionimatice domande multimodali.
Sebbene questa settimana siano iniziati i test limitati per il modello più recente, la funzionalità di ragionamento sarà accessibile a un maggior numero di utenti solo all'inizio del prossimo anno.
Secondo Google, il modello di ragionamento si basa sul chip di intelligenza artificiale di sesta generazione del gigante dei motori di ricerca , Trillium, che è stato reso disponibile anche ai clienti di Google Cloud mercoledì.
Nel suo post , Google ha rivelato che il nuovo chip offre prestazioni 4 volte migliori ed è più efficiente dal punto di vista energetico del 67% rispetto al suo predecessore.
Stiamo dando il via all'era Gemini 2.0 con Gemini 2.0 Flash, che supera la versione 1.5 Pro nei benchmark chiave a una velocità doppia (vedi grafico sotto). Sono particolarmente entusiasta di vedere i rapidi progressi nella programmazione, e ne arriveranno altri.
Gli sviluppatori possono provare una versione sperimentale in AI… pic.twitter.com/iEAV8dzkaW
— Sundar Pichai (@sundarpichai) 11 dicembre 2024
Il CEO di Google ha anche annunciato altre funzionalità, come la nuova funzionalità di Gemini, denominata Deep Research, che può fungere da assistente di ricerca utilizzando capacità di ragionamento avanzato e di contesto esteso. Questa nuova funzionalità è disponibile in Gemini Advanced ed è in grado di compilare report di ricerca per conto dell'utente.
Hassabis ha affermato che Gemini 2.0 sta gettando le basi per un grande 2025.
"Consideriamo il 2025 come il vero inizio dell'era basata sugli agenti"
Hassabis.
Ciò avviene mentre l'azienda ha annunciato il lancio di un altro prodotto, Project Mariner , una nuova estensione sperimentale di Chrome che può letteralmente utilizzare un browser web per gli utenti.
Inoltre, Google ha annunciato anche Jules, un agente creato appositamente per aiutare gli sviluppatori a individuare e correggere il codice difettoso, e un nuovo agente basato su Gemini 2.0 in grado di analizzare gli schermi degli utenti e aiutarli a giocare meglio ai videogiochi.
Secondo Hassabis, l'agente di gioco, che lui definisce un "Easter egg", indica che si tratta di un gioco realmente multimodale.

