派早报:Mistral 发布 Voxtral Transcribe 2 系列语音转文字模型等
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
Mistral AI 于 2 月 4 日发布了 Voxtral Transcribe 2 系列模型,包括用于批量处理的 Voxtral Mini Transcribe V2 和实时转录的 Voxtral Realtime。后者开源,延迟低于 200 毫秒,支持 13 种语言,定价分别为每分钟 0.003 和 0.006 美元。
🎯
关键要点
- Mistral AI 于 2 月 4 日发布 Voxtral Transcribe 2 系列模型。
- Voxtral Transcribe 2 系列包括 Voxtral Mini Transcribe V2 和 Voxtral Realtime。
- Voxtral Realtime 以 Apache 2.0 许可开源,延迟低于 200 毫秒。
- Voxtral Realtime 参数规模为 4B,采用全新流式架构。
- Voxtral Mini Transcribe V2 主打高性价比,准确率优于 GPT-4o mini Transcribe 和 Gemini 2.5 Flash。
- 两款模型支持包括中文在内的 13 种语言。
- Voxtral Mini Transcribe V2 定价为每分钟 0.003 美元,Voxtral Realtime 为每分钟 0.006 美元。
🏷️
标签
➡️