Mistral AI于2026年2月开源了Voxtral Mini 4B Realtime 2602模型,支持13种语言的实时语音转录,延迟低于500毫秒,适合轻量化应用,并可在边缘计算单元上部署,提升语音识别的精度与效率。
Otter AI是实时语音转录应用程序,可帮助用户在会议、采访或讲座中做笔记。其他免费替代方案包括Descript和Fireflies.ai,它们提供类似的转录服务。Watson Speech to Text是一种API,可将多种语言的语音转录为文本。
完成下面两步后,将自动完成登录并继续当前操作。