Il CEO di DeepMind di Google riconosce anche la difficoltà di Google nel mantenere la sua posizione di rilievo nella generazione di tecnologie video come OpenAI Family, che ha ottenuto un notevole successo sul mercato in questo ambito tecnologico. Questa affermazione non è più sufficiente se entrambe le aziende continuano a progredire nell'umanizzazione dei contenuti video, poiché entrambe le aziende tecnologiche continuano a spingere i limiti delle capacità dell'intelligenza artificiale nella creazione di video realistici a partire da prompt di testo.
L'alba dei video generati dall'intelligenza artificiale
OpenAI ha recentemente presentato Sora, un'intelligenza artificiale coinvolgente in grado di generare automaticamente video fino a 60 secondi con scene complesse che coinvolgono alcuni personaggi. A febbraio, Sora ha lanciato dei video dimostrativi dell'estensione Figma, diventati virali, che mostravano la possibilità di creare inquadrature ricche di dettagli e dinamiche, anziché solo testo su tela. Questa intelligenza artificiale è decisamente innovativa, e indica defila possibilità che in futuro la creazione di contenuti e la narrazione digitale basate sull'intelligenza artificiale si evolveranno per prendere il posto dei narratori umani.
Google ha creato il suo generatore multifunzionale di testo in video denominato "Lumiere". Lumiere è stato presentato in un articolo di ricerca nel numero di gennaio. Lumiere è in grado di generare video di cinque secondi e sarebbe davvero impressionante affermare che Lumiere, alla velocità di un minuto, sia abbastanza competente da immaginare tutto ciò che Sora fa in video complessi della durata di un minuto. Google ha sottolineato il fatto che l'intelligenza artificiale dovrebbe essere progettata in modo sicuro, il che include la protezione dal cambiamento climatico, l'uso improprio o la produzione di contenuti pericolosi. Questa dichiarazione di moralità è emersa quando Google ha ritardato il lancio del suo generatore di immagini basato sul deep learning, Gemini, dopo aver generato immagini criticate per le continue inesattezze storiche.
La sfida dei dati e dell'etica nello sviluppo dell'intelligenza artificiale
I giochi di Google DeepMind e Open AI sono strettamente interconnessi non solo con la qualità dei loro modelli di intelligenza artificiale, ma anche con i limiti tecnologici e la partecipazione umana. Gran parte del problema risiede nell'acquisizione dei dati necessaria per addestrare questi modelli in grandi quantità, e questa è la base per il progresso della tecnologia di intelligenza artificiale.
Due aziende erano coinvolte in un'iniziativa congiunta e si sono scontrate per ottenere dati, che sono diventati parte del fatale sistema di addestramento per i video di YouTube. Mira Murati, CTO di OpenAI, ha dichiarato in un'intervista al Wall Street Journal che la natura dell'addestramento di Sora era approssimativa. Il modello di Sora probabilmente non aveva le funzionalità di una rete neurale profonda, che avrebbe aiutato a comprendere un contenuto complesso come una clip.
Neal Mohan, l'attuale CEO di YouTube, ha confutato queste affermazioni concentrandosi sulle policy che verrebbero sicuramente violate da questo metodo, affermando che questo approccio violerebbe i termini d'uso di YouTube. Nonostante queste ipotesi, esistono alcune raccomandazioni riguardanti l'uso dei video di YouTube per il progresso dello strumento di riconoscimento vocale Whisper, il che aggiunge ulteriori questioni complesse relative all'utilizzo etico dei dati nell'addestramento dell'intelligenza artificiale.
La generazione video AI da una prospettiva diversa
Le preoccupazioni etiche legate all'utilizzo dei dati e all'abuso delle tecnologie di intelligenza artificiale sono sempre state significative per gli sviluppatori e gli enti regolatori di intelligenza artificiale. L'affidabilità dell'algoritmo nel valutare gli usi intenzionalmente scorretti e nel prevenire intenti malevoli rappresenta una tendenza di sviluppo più ampia nel settore dell'intelligenza artificiale, orientata a uno sviluppo responsabile dell'intelligenza artificiale. Al contrario, l'tracriscontrata nel rapido sviluppo di sistemi intelligenti, incluso Sora di OpenAI, introduce delle complicazioni nell'implementazione di questi codici morali.
Il fatto che Google DeepMind e OpenAI siano in contrasto tra loro rivela in gran parte la stessa storia di una grande competizione tra titani della tecnologia nell'innovazione tecnologica dell'intelligenza artificiale. Mentre OpenAI ha fatto finora un ottimo lavoro con Sora, Google non solo sta producendo Lumiere, ma sta anche lavorando allo sviluppo di un'intelligenza artificiale etica, il che dimostra che la questione della supremazia dell'intelligenza artificiale è tutt'altro che conclusa. Il percorso verso il successo nella creazione di un'intelligenza artificiale in grado di avviare video sempre più complessi in termini di realismo e complessità rende la tecnologia, l'etica e la creatività agili.
L'esplorazione del settore, da parte sua, sarà essenziale, poiché sarà cruciale un equilibrio tra innovazione e responsabilità. Aziende come Google DeepMind e Open AI non sono solo impegnate nella competizione per lo sviluppo dell'IA più innovativa, ma anche nella definizione di un paradigma etico che governerà il futuro del mondo dell'IA. L'esito di questa gara determinerà probabilmente il futuro di elementi vitali come i media digitali, la creazione di contenuti o il ruolo dell'IA nelle nostre vite, apportando modifiche a questi ambiti per gli anni a venire.

