派早报:Mistral 发布 Voxtral Transcribe 2 系列语音转文字模型等

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

Mistral AI 于 2 月 4 日发布了 Voxtral Transcribe 2 系列模型,包括用于批量处理的 Voxtral Mini Transcribe V2 和实时转录的 Voxtral Realtime。后者开源,延迟低于 200 毫秒,支持 13 种语言,定价分别为每分钟 0.003 和 0.006 美元。

🎯

关键要点

  • Mistral AI 于 2 月 4 日发布 Voxtral Transcribe 2 系列模型。
  • Voxtral Transcribe 2 系列包括 Voxtral Mini Transcribe V2 和 Voxtral Realtime。
  • Voxtral Realtime 以 Apache 2.0 许可开源,延迟低于 200 毫秒。
  • Voxtral Realtime 参数规模为 4B,采用全新流式架构。
  • Voxtral Mini Transcribe V2 主打高性价比,准确率优于 GPT-4o mini Transcribe 和 Gemini 2.5 Flash。
  • 两款模型支持包括中文在内的 13 种语言。
  • Voxtral Mini Transcribe V2 定价为每分钟 0.003 美元,Voxtral Realtime 为每分钟 0.006 美元。
➡️

继续阅读