ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

Mistral rilascia un nuovo modello audio AI chiamato Voxtral

DiRanda MosesRanda Moses
Tempo di lettura: 2 minuti.
Mistral rilascia un nuovo modello audio AI chiamato Voxtral.
  • Mistral ha annunciato il rilascio di un nuovo modello audio basato sull'intelligenza artificiale chiamato Voxtral.
  • Il modello audio è disponibile in due varianti: Voxtral Small e Voxtral Mini.
  • Mistral ha affermato che Voxtral supera in prestazioni altri modelli audio come Whisper large-v3 e Scribe.

Mistral ha annunciato il rilascio di un nuovo modello di intelligenza artificiale per l'audio, chiamato Voxtral. L'azienda francese specializzata in IA ha dichiarato che il modello è pensato per le aziende ed è considerato la prima famiglia di modelli linguistici su larga scala (LLM) focalizzata sull'intelligenza artificiale applicata all'audio.

Secondo l'azienda francese di intelligenza artificiale, Voxtral è progettato per fornire intelligenza vocale pratica in applicazioni reali. Il modello audio basato sull'intelligenza artificiale supera Whisper large-v3, uno dei migliori modelli di trascrizione audio open source.

Voxtral è alimentato da Mistral Small 3.1

Voxtral si basa sul modello di linguaggio di grandi dimensioni (LLM) Mistral Small 3.1. Il modello di intelligenza artificiale audio è in grado di comprendere più lingue, come inglese, francese, spagnolo, portoghese, italiano, tedesco, olandese, hindi e altre ancora.

Il modello audio è in grado di trascrivere fino a 30 minuti di audio. Inoltre, Voxtral può comprendere fino a 40 minuti di audio, il che semplifica la conversazione e la formulazione di domande pertinenti da parte degli utenti. Gli utenti possono anche richiedere di generare riepiloghi testuali del file audio o di fornire analisi e approfondimenti dettagliati. Possono anche eseguire altre azioni, come l'esecuzione di funzioni tramite una chiamata API.

Mistral offre i "modelli di comprensione vocale" di Voxtral in due varianti chiamate Voxtral Small e Voxtral Mini. Entrambi i modelli sono in grado di interagire con comandi vocali o con una combinazione di comandi audio e testuali.

Il modello più potente dei due, Voxtral Small, dispone di 24 miliardi di parametri, ideali per implementazioni su scala produttiva. Mistral ha affermato che "Voxtral Small è competitivo con GPT-4o-mini e Gemini 2.5 Flash in tutte le attività".

Mistral rilascia un nuovo modello audio AI chiamato Voxtral.
Fonte: Mistral AI.

Voxtral Mini è un'opzione più leggera con parametri 3B, che la rende la sceltatronper implementazioni locali ed edge. La sua versione API, Voxtral Mini Transcribe, non solo è conveniente, ma supera anche Whisper di OpenAI, a meno della metà del prezzo.

Sia Voxtral Small (24B) che Voxtral Mini (3B) sono disponibili per il download e l'hosting locale da Hugging Face. Gli sviluppatori possono anche integrare i modelli audio tramite una singola chiamata API in qualsiasi applicazione. Il prezzo parte da $ 0,001 al minuto, rendendo la trascrizione scalabile. Mistral ha dichiarato che Voxtral sarà disponibile su Le Chat nell'app web o nell'app mobile entro le prossime due settimane.

Mistral è una delle aziende leader nel settore dell'intelligenza artificiale in Europa. Secondo quanto riportato, l'azienda, fondata nel 2023, ha raccolto oltre 1 miliardo di euro (circa 1,2 miliardi di dollari) da aziende note come Andreessen Horowitz, Nvidia, Samsung e Salesforce.

Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.

Condividi questo articolo
ALTRE NOTIZIE
INTENSIVO CRIPTOVALUTE
CORSO