ÚLTIMAS NOTICIAS
SELECCIONADO PARA TI
SEMANALMENTE
MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

Mistral lanza un nuevo modelo de audio con IA llamado Voxtral

PorRanda MoisésRanda Moisés
Lectura de 2 minutos.
Mistral lanza un nuevo modelo de audio de IA llamado Voxtral.
  • Mistral ha anunciado el lanzamiento de un nuevo modelo de audio de IA llamado Voxtral.
  • El modelo de audio viene en dos variantes: Voxtral Small y Voxtral Mini.
  • Mistral afirmó que Voxtral supera a otros modelos de audio como Whisper large-v3 y Scribe.

Mistral ha anunciado el lanzamiento de un nuevo modelo de IA de audio llamado Voxtral. La empresa francesa de IA afirmó que el modelo está orientado a las empresas y se considera la primera familia de grandes modelos de lenguaje (LLM, por sus siglas en inglés) centrada en la IA de audio.

Según la empresa francesa de IA, Voxtral está diseñado para ofrecer inteligencia de voz práctica en aplicaciones del mundo real. El modelo de audio de IA supera a Whisper large-v3, uno de los mejores modelos de transcripción de audio de código abierto.

Voxtral funciona con Mistral Small 3.1

Voxtral funciona con el modelo de lenguaje extenso (LLM) Mistral Small 3.1. El modelo de IA de audio puede comprender varios idiomas, como inglés, francés, español, portugués, italiano, alemán, neerlandés, hindi y más.

El modelo de audio puede transcribir hasta 30 minutos de audio. Además, Voxtral puede comprender hasta 40 minutos de audio, lo que facilita a los usuarios conversar y hacer preguntas relevantes. Los usuarios también pueden solicitarle que genere resúmenes de texto del archivo de audio o que proporcione análisis e información detallada. También pueden ejecutar otras acciones, como ejecutar funciones mediante una llamada a la API.

Mistral ofrece los modelos de comprensión del habla de Voxtral en dos versiones: Voxtral Small y Voxtral Mini. Ambos modelos pueden interactuar con indicaciones de voz o con una combinación de indicaciones de audio y texto.

El modelo más potente de los dos, Voxtral Small, cuenta con 24 mil millones de parámetros, ideal para implementaciones a escala de producción. Mistral escribió que «Voxtral Small es competitivo con GPT-4o-mini y Gemini 2.5 Flash en todas las tareas».

Mistral lanza un nuevo modelo de audio de IA llamado Voxtral.
Fuente: Mistral AI.

Voxtral Mini es una opción más ligera con parámetros 3B, lo que la convierte en una opcióntronpara implementaciones locales y en el borde. Su versión API, Voxtral Mini Transcribe, no solo es rentable, sino que también supera a Whisper de OpenAI, a menos de la mitad del precio.

Tanto Voxtral Small (24B) como Voxtral Mini (3B) están disponibles para descarga y alojamiento local en Hugging Face. Los desarrolladores también pueden integrar los modelos de audio en cualquier aplicación mediante una sola llamada a la API. El precio inicial es de $0.001 por minuto, lo que permite una transcripción escalable. Mistral afirmó que Voxtral estará disponible en Le Chat, tanto en la aplicación web como en la aplicación móvil, en las próximas semanas.

Mistral es una de las empresas líderes en inteligencia artificial en Europa. Según informes, la compañía, fundada en 2023, ha recaudado más de mil millones de euros (unos 1200 millones de dólares) de empresas reconocidas como Andreessen Horowitz, Nvidia, Samsung y Salesforce.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Comparte este artículo
MÁS… NOTICIAS
INTENSIVO CRIPTOMONEDAS
CURSO