派早报:Mistral 发布 Voxtral Transcribe 2 系列语音转文字模型等
内容提要
Mistral AI 于 2 月 4 日发布了 Voxtral Transcribe 2 系列语音转文字模型,包括面向批量处理的 Voxtral Mini Transcribe V2 和实时转录的 Voxtral Realtime。Voxtral Realtime 具有低于 200 ms 的延迟,支持 13 种语言。定价方面,Mini Transcribe V2 每分钟 0.003 美元,Realtime 每分钟 0.006 美元。
关键要点
-
Mistral AI 于 2 月 4 日发布了 Voxtral Transcribe 2 系列语音转文字模型,包括 Voxtral Mini Transcribe V2 和 Voxtral Realtime。
-
Voxtral Realtime 具有低于 200 ms 的延迟,支持 13 种语言,并以 Apache 2.0 许可开源发布。
-
Voxtral Mini Transcribe V2 主打高性价比,准确率优于 GPT-4o mini Transcribe 与 Gemini 2.5 Flash,单次请求最多可处理 3 小时录音。
-
定价方面,Voxtral Mini Transcribe V2 每分钟 0.003 美元,Voxtral Realtime 每分钟 0.006 美元。
延伸问答
Voxtral Transcribe 2 系列模型有哪些特点?
Voxtral Transcribe 2 系列包括 Voxtral Mini Transcribe V2 和 Voxtral Realtime,支持13种语言,Voxtral Realtime 延迟低于200 ms,适合实时转录。
Voxtral Mini Transcribe V2 的定价是多少?
Voxtral Mini Transcribe V2 的定价为每分钟0.003美元。
Voxtral Realtime 模型适合什么场景?
Voxtral Realtime 模型适合低延迟场景,能够进行实时转录,延迟低于200 ms。
Voxtral Mini Transcribe V2 的准确率如何?
Voxtral Mini Transcribe V2 的准确率优于 GPT-4o mini Transcribe 和 Gemini 2.5 Flash。
Voxtral Realtime 的开源许可是什么?
Voxtral Realtime 以 Apache 2.0 许可开源发布。
Voxtral Transcribe 2 系列支持哪些语言?
Voxtral Transcribe 2 系列支持包括中文在内的13种语言。