少数派 ·

派早报：Mistral 发布 Voxtral Transcribe 2 系列语音转文字模型等

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

Mistral AI 于 2 月 4 日发布了 Voxtral Transcribe 2 系列语音转文字模型，包括面向批量处理的 Voxtral Mini Transcribe V2 和实时转录的 Voxtral Realtime。Voxtral Realtime 具有低于 200 ms 的延迟，支持 13 种语言。定价方面，Mini Transcribe V2 每分钟 0.003 美元，Realtime 每分钟 0.006 美元。

🎯

关键要点

Mistral AI 于 2 月 4 日发布了 Voxtral Transcribe 2 系列语音转文字模型，包括 Voxtral Mini Transcribe V2 和 Voxtral Realtime。
Voxtral Realtime 具有低于 200 ms 的延迟，支持 13 种语言，并以 Apache 2.0 许可开源发布。
Voxtral Mini Transcribe V2 主打高性价比，准确率优于 GPT-4o mini Transcribe 与 Gemini 2.5 Flash，单次请求最多可处理 3 小时录音。
定价方面，Voxtral Mini Transcribe V2 每分钟 0.003 美元，Voxtral Realtime 每分钟 0.006 美元。

🔎

延伸解读

Voxtral Realtime 的优势

Voxtral Realtime 模型的低延迟特性（低于 200 ms）使其非常适合实时应用场景，如在线会议和直播。这种快速响应能力能够显著提升用户体验，尤其是在多语言环境中，支持 13 种语言的功能也为全球用户提供了便利。

高性价比的选择

Voxtral Mini Transcribe V2 以其每分钟仅 0.003 美元的定价，成为高性价比的语音转文字解决方案。其准确率优于其他同类产品，适合需要处理大量录音的用户，尤其是在教育和内容创作领域，能够有效降低成本。

开源许可的意义

Voxtral Realtime 采用 Apache 2.0 许可开源发布，这意味着开发者可以自由使用和修改该模型。这种开放性不仅促进了技术的传播与应用，也为开发者提供了更多的创新空间，可能会催生出更多基于该模型的应用。

❓

延伸问答

Voxtral Transcribe 2 系列模型有哪些特点？

Voxtral Transcribe 2 系列包括 Voxtral Mini Transcribe V2 和 Voxtral Realtime，支持13种语言，Voxtral Realtime 延迟低于200 ms，适合实时转录。

Voxtral Mini Transcribe V2 的定价是多少？

Voxtral Mini Transcribe V2 的定价为每分钟0.003美元。

Voxtral Realtime 模型适合什么场景？

Voxtral Realtime 模型适合低延迟场景，能够进行实时转录，延迟低于200 ms。

Voxtral Mini Transcribe V2 的准确率如何？

Voxtral Mini Transcribe V2 的准确率优于 GPT-4o mini Transcribe 和 Gemini 2.5 Flash。

Voxtral Realtime 的开源许可是什么？

Voxtral Realtime 以 Apache 2.0 许可开源发布。

Voxtral Transcribe 2 系列支持哪些语言？

Voxtral Transcribe 2 系列支持包括中文在内的13种语言。

🏷️