即构云端实时语音识别上线,实现语音通话实时字幕&翻译、直播字幕等功能

即构云端实时语音识别上线,实现语音通话实时字幕&翻译、直播字幕等功能

💡 原文中文,约900字,阅读约需2分钟。
📝

内容提要

即构科技(ZEGO)推出云端实时语音识别API,支持语音通话和视频直播等场景,延迟约600ms,识别准确度提升40%以上,支持多语言,成本降低50%,适用于在线会议和直播字幕。

🎯

关键要点

  • 即构科技(ZEGO)推出云端实时语音识别API,支持语音通话、视频直播和在线会议等场景。
  • 识别延迟约600ms,用户说话结束后可快速获得识别结果。
  • 语音识别准确度提升40%以上,具备特定优化的降噪能力。
  • AI回声消除能力更优,减少误识别情况。
  • 相较于传统方案,成本降低50%以上,仅在有效内容时启动语音识别。
  • 支持多种语言,包括中文、英语、韩语、日语等多达20种语言。
  • 可实现在线会议实时字幕、多语种语聊房互动和全球直播字幕等应用场景。

延伸问答

即构科技的云端实时语音识别API支持哪些场景?

支持语音通话、视频直播和在线会议等场景。

即构科技的语音识别延迟是多少?

识别延迟约为600ms。

该语音识别API的准确度提升了多少?

识别准确度提升了40%以上。

即构科技的语音识别API如何降低成本?

相较于传统方案,成本降低50%以上,仅在有效内容时启动语音识别。

该API支持哪些语言?

支持多达20种语言,包括中文、英语、韩语、日语等。

即构科技的语音识别API有哪些降噪能力?

具备特定优化的降噪能力,去除环境噪声和远处人声等干扰。

➡️

继续阅读