Un'azienda cinese specializzata in intelligenza artificiale ha integrato il riconoscimento di immagini e video nel suo chatbot principale.
Allo stesso tempo, i produttori locali di chip hanno dimostrato di poter ora eguagliare il rapido supporto al lancio di nuovi prodotti che un tempo era un punto di forza americano.
DeepSeek, un'azienda con sede a Hangzhou, ha aggiunto silenziosamente una nuova funzionalità chiamata "modalità di riconoscimento immagini" alla sua piattaforma di chat. Questa nuova modalità si aggiunge ad altre due modalità lanciate dall'azienda all'inizio di questo mese: "esperto" e "flash"
La nuova funzionalità consente al chatbot di comprendere foto e video, non solo il testo.
Questo lo allinea ad altri importanti chatbot basati sull'intelligenza artificiale che offrono funzionalità simili da tempo.
Chen Xiaokang, responsabile del team multimodale di DeepSeek, ha affermato che lo strumento è stato inizialmente testato con un piccolo gruppo di utenti sia sul sito web che sull'app mobile.
Chen Deli, ricercatore senior presso l'azienda, ha celebrato il lancio con un breve post che faceva riferimento al logo dell'azienda: "Ora anche la piccola balena può vedere".
La funzionalità di acquisizione di immagini e video è stata introdotta pochi giorni dopo che DeepSeek ha rilasciato un'anteprima del suo nuovo modello di punta, DeepSeek-V4, e ha reso disponibili a chiunque i pesi del modello per il download e l'utilizzo.
V4 non è un singolo modello, bensì due. Il primo, DeepSeek-V4-Pro, ha 1,6 trilioni di parametri ed è progettato per attività complesse che richiedono ragionamenti elaborati e flussi di lavoro automatizzati a più fasi.
Il secondo, DeepSeek-V4-Flash, è progettato per gestire un elevato numero di richieste a un costo inferiore. Entrambi i modelli supportano una finestra di contesto di un milione di token.
Utilizzano inoltre un design ibrido basato sull'attenzione che, secondo l'azienda, riduce la potenza di calcolo e la memoria necessarie durante l'inferenza.
I produttori cinesi di chip raggiungono un nuovo traguardo
Ciò che ha attirato l'attenzione di molti osservatori del settore non è stato solo il modello in sé, ma anche ciò che è accaduto il giorno del suo lancio.
Quattro aziende cinesi produttrici di chip, Huawei Ascend, Cambricon, Hygon Information e Moore Threads, hanno confermato che il loro hardware ha funzionato perfettamente con V4 fin dal primo giorno del suo rilascio.
Questo tipo di supporto immediato, in cui un nuovo modello funziona senza problemi su chip non NVIDIA subito dopo il lancio anziché settimane o mesi dopo, era in precedenza quasi impossibile al di fuori dell'ecosistema NVIDIA.
I chip Ascend di Huawei, inclusi A2, A3 e 950, supportano sia V4-Pro che V4-Flash.
L'azienda ha dichiarato che il suo chip Ascend 950 utilizza processi di calcolo integrati e flussi di elaborazione parallela per velocizzare l'inferenza.
Cambricon ha completato il suo adattamento utilizzando il framework di inferenza open-source vLLM e ha condiviso il codice su GitHub.
Hygon ha dichiarato di aver effettuato un'approfondita ottimizzazione del modello sulla sua piattaforma DCU per creare un percorso agevole dal rilascio del modello al suo utilizzo effettivo.
Moore Threads ha collaborato con l'Accademia di Intelligenza Artificiale di Pechino per eseguire V4 sulla sua scheda MTT S5000 utilizzando lo stack software FlagOS.
Secondo gli osservatori del settore, questo lancio coordinato rappresenta un vero cambiamento.
Per anni, lo sviluppo di chip prodotti al di fuori dell'ecosistema Nvidia ha richiesto mesi per supportare un nuovo modello importante. Riuscire a far funzionare otto diversi chipset nazionali fin dal primo giorno rappresenta un traguardo significativo.
Il quadro generale: costi e indipendenza per Deepseek
Secondo gli osservatori, il significato più profondo di questo lancio risiede nel fatto che DeepSeek ha dimostrato di poter offrire un'intelligenza artificiale di alto livello senza dipendere da hardware occidentale.
Facendo funzionare i suoi modelli nativamente su più chip cinesi contemporaneamente, riduce il rischio derivante dalle restrizioni all'esportazione che hanno impedito alle aziende cinesi di accedere ai processori americani più potenti.
Anche il costo è importante. DeepSeek si è impegnata a fondo per mantenere bassi i costi di gestione dei suoi modelli. Questo facilita alle aziende la creazione di sistemi automatizzati senza dover affrontare costi di elaborazione eccessivamente elevati.
In questo modo, gli aggiornamenti e il lancio di Deepseek non riguardano principalmente una singola innovazione tecnica, ma piuttosto l'integrazione di un'intera catena di fornitura.
A partire da questa pubblicazione, la questione di chi sia leader nell'IA sembra spostarsi da chi crea il modello più intelligente a chi è in grado di mantenere l'intero sistema operativo in modo economico edenta lungo termine.

