- Mistral公司宣布推出一款名为Voxtral的全新AI音频模型。.
- 该音频型号有两种版本:Voxtral Small 和 Voxtral Mini。.
- Mistral 表示,Voxtral 的性能优于其他音频型号,如 Whisper large-v3 和 Scribe。.
Mistral宣布推出名为Voxtral的全新音频人工智能模型。 该公司表示,该模型面向企业用户,是首个专注于音频人工智能的大型语言模型(LLM)系列。
据这家法国人工智能公司称,Voxtral旨在为实际应用提供实用的语音智能。该人工智能音频模型性能优于Whisper large-v3,后者是目前顶尖的开源音频转录模型之一。.
Voxtral 由 Mistral Small 3.1 提供支持
Voxtral 由大型语言模型 (LLM) Mistral Small 3.1 提供支持。该音频 AI 模型可以理解多种语言,例如英语、法语、西班牙语、葡萄牙语、意大利语、德语、荷兰语、印地语等。.
该音频模型能够转录长达 30 分钟的音频。此外,Voxtral 可以理解长达 40 分钟的音频,方便用户进行对话并提出相关问题。用户还可以要求它生成音频文件的文本摘要,或提供分析和详细见解。他们还可以执行其他操作,例如通过 API 调用运行函数。.
Mistral 提供 Voxtral 的“语音理解模型”,分为 Voxtral Small 和 Voxtral Mini 两种版本。这两种模型均能够与基于语音的提示或音频和文本组合的提示进行交互。
两款型号中功能更强大的 Voxtral Small 拥有 240 亿个参数,非常适合生产规模的部署。Mistral 写道 :“Voxtral Small 在所有任务上都可与 GPT-4o-mini 和 Gemini 2.5 Flash 相媲美。”

Voxtral Mini 是一款轻量级产品,拥有 30 亿个参数,是本地和边缘部署的tron之选。其 API 版本 Voxtral Mini Transcribe 不仅经济实惠,而且性能优于 OpenAI 的 Whisper,价格却不到后者的一半。.
Voxtral Small (24B) 和 Voxtral Mini (3B) 均可从 Hugging Face 下载并本地部署。开发者还可以通过一次 API 调用将这些音频模型集成到任何应用程序中。价格低至每分钟 0.001 美元,使转录功能可扩展。Mistral 表示,Voxtral 将 Le Chat 在未来几周内
Mistral是欧洲领先的人工智能公司之一。据报道,该公司成立于2023年,已从Andreessen Horowitz、Nvidia、三星和Salesforce等知名公司筹集了超过10亿欧元(约12亿美元)的资金。.
如果你正在阅读这篇文章,你已经领先一步了。 订阅我们的新闻简报,继续保持领先优势。

兰达·摩西
兰达是一位专攻科技领域的作家和编辑。她毕业于布拉德福德大学,获得电气与tron工程学位。她曾就职于 Forward Protocol、Amazix 和 Cryptosomniac。.
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)















