Mistral发布了一款名为Voxtral的全新AI音频模型。

经过

兰达·摩西

阅读时长：2分钟 2025年7月16日

照片由 Solen Feyissa 在 Unsplash

Mistral公司宣布推出一款名为Voxtral的全新AI音频模型。.
该音频型号有两种版本：Voxtral Small 和 Voxtral Mini。.
Mistral 表示，Voxtral 的性能优于其他音频型号，如 Whisper large-v3 和 Scribe。.

Mistral宣布推出名为Voxtral的全新音频人工智能模型。 该公司表示，该模型面向企业用户，是首个专注于音频人工智能的大型语言模型（LLM）系列。

据这家法国人工智能公司称，Voxtral旨在为实际应用提供实用的语音智能。该人工智能音频模型性能优于Whisper large-v3，后者是目前顶尖的开源音频转录模型之一。.

Voxtral 由 Mistral Small 3.1 提供支持

Voxtral 由大型语言模型 (LLM) Mistral Small 3.1 提供支持。该音频 AI 模型可以理解多种语言，例如英语、法语、西班牙语、葡萄牙语、意大利语、德语、荷兰语、印地语等。.

该音频模型能够转录长达 30 分钟的音频。此外，Voxtral 可以理解长达 40 分钟的音频，方便用户进行对话并提出相关问题。用户还可以要求它生成音频文件的文本摘要，或提供分析和详细见解。他们还可以执行其他操作，例如通过 API 调用运行函数。.

Mistral 提供 Voxtral 的“语音理解模型”，分为 Voxtral Small 和 Voxtral Mini 两种版本。这两种模型均能够与基于语音的提示或音频和文本组合的提示进行交互。

两款型号中功能更强大的 Voxtral Small 拥有 240 亿个参数，非常适合生产规模的部署。Mistral 写道：“Voxtral Small 在所有任务上都可与 GPT-4o-mini 和 Gemini 2.5 Flash 相媲美。”

Voxtral Mini 是一款轻量级产品，拥有 30 亿个参数，是本地和边缘部署的tron之选。其 API 版本 Voxtral Mini Transcribe 不仅经济实惠，而且性能优于 OpenAI 的 Whisper，价格却不到后者的一半。.

Voxtral Small (24B) 和 Voxtral Mini (3B) 均可从 Hugging Face 下载并本地部署。开发者还可以通过一次 API 调用将这些音频模型集成到任何应用程序中。价格低至每分钟 0.001 美元，使转录功能可扩展。Mistral 表示，Voxtral 将在未来几周内上线Le Chat的网页版和移动版应用。

Mistral是欧洲领先的人工智能公司之一。据报道，该公司成立于2023年，已从Andreessen Horowitz、Nvidia、三星和Salesforce等知名公司筹集了超过10亿欧元（约12亿美元）的资金。.

最顶尖的加密货币专家都在阅读我们的简报。想加入他们？

欧元区米斯特拉尔

分享这篇文章

兰达·摩西

Randa Moses是 Cryptopolitan 的编辑和记者，主要报道科技、人工智能、机器人、加密货币、诈骗和黑客攻击等领域。她自2017年起便投身于加密货币领域，曾就职于Forward Protocol、AmaZix和Cryptosomniac等公司。Randa拥有布拉德福德大学电气与tron工程学位。.