Mistral rilascia un nuovo modello audio AI chiamato Voxtral

- Mistral ha annunciato il rilascio di un nuovo modello audio basato sull'intelligenza artificiale chiamato Voxtral.
- Il modello audio è disponibile in due varianti: Voxtral Small e Voxtral Mini.
- Mistral ha affermato che Voxtral supera in prestazioni altri modelli audio come Whisper large-v3 e Scribe.
Mistral ha annunciato il rilascio di un nuovo modello di intelligenza artificiale per l'audio, chiamato Voxtral. L'azienda francese specializzata in IA ha dichiarato che il modello è pensato per le aziende ed è considerato la prima famiglia di modelli linguistici su larga scala (LLM) focalizzata sull'intelligenza artificiale applicata all'audio.
Secondo l'azienda francese di intelligenza artificiale, Voxtral è progettato per fornire intelligenza vocale pratica in applicazioni reali. Il modello audio basato sull'intelligenza artificiale supera Whisper large-v3, uno dei migliori modelli di trascrizione audio open source.
Voxtral è alimentato da Mistral Small 3.1
Voxtral si basa sul modello di linguaggio di grandi dimensioni (LLM) Mistral Small 3.1. Il modello di intelligenza artificiale audio è in grado di comprendere più lingue, come inglese, francese, spagnolo, portoghese, italiano, tedesco, olandese, hindi e altre ancora.
Il modello audio è in grado di trascrivere fino a 30 minuti di audio. Inoltre, Voxtral può comprendere fino a 40 minuti di audio, il che semplifica la conversazione e la formulazione di domande pertinenti da parte degli utenti. Gli utenti possono anche richiedere di generare riepiloghi testuali del file audio o di fornire analisi e approfondimenti dettagliati. Possono anche eseguire altre azioni, come l'esecuzione di funzioni tramite una chiamata API.
Mistral offre i "modelli di comprensione vocale" di Voxtral in due varianti chiamate Voxtral Small e Voxtral Mini. Entrambi i modelli sono in grado di interagire con comandi vocali o con una combinazione di comandi audio e testuali.
Il modello più potente dei due, Voxtral Small, dispone di 24 miliardi di parametri, ideali per implementazioni su scala produttiva. Mistral ha affermato che "Voxtral Small è competitivo con GPT-4o-mini e Gemini 2.5 Flash in tutte le attività".

Voxtral Mini è un'opzione più leggera con parametri 3B, che la rende la sceltatronper implementazioni locali ed edge. La sua versione API, Voxtral Mini Transcribe, non solo è conveniente, ma supera anche Whisper di OpenAI, a meno della metà del prezzo.
Sia Voxtral Small (24B) che Voxtral Mini (3B) sono disponibili per il download e l'hosting locale da Hugging Face. Gli sviluppatori possono anche integrare i modelli audio tramite una singola chiamata API in qualsiasi applicazione. Il prezzo parte da $ 0,001 al minuto, rendendo la trascrizione scalabile. Mistral ha dichiarato che Voxtral sarà disponibile su Le Chat nell'app web o nell'app mobile entro le prossime due settimane.
Mistral è una delle aziende leader nel settore dell'intelligenza artificiale in Europa. Secondo quanto riportato, l'azienda, fondata nel 2023, ha raccolto oltre 1 miliardo di euro (circa 1,2 miliardi di dollari) da aziende note come Andreessen Horowitz, Nvidia, Samsung e Salesforce.
Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.
CORSO
- Quali criptovalute possono farti guadagnare
- Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
- Strategie di investimento poco conosciute utilizzate dai professionisti
- Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)















