Verbit 推出用于 ASR 直播字幕的说话人识别技术

Verbit 推出用于 ASR 直播字幕的说话人识别技术

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

AI语音转录平台Verbit更新了Captivate ASR解决方案,能够识别自动字幕中的特定发言者特征,从而提供清晰的说话者字幕。该技术适用于新闻、天气和体育直播,提升实时字幕的准确性和清晰度。

🎯

关键要点

  • AI语音转录平台Verbit更新了Captivate ASR解决方案,能够识别自动字幕中的特定发言者特征。
  • 该技术提供清晰的说话者字幕,替代传统的通用楔形或破折号。
  • Verbit的全球准备团队在节目播出前捕捉指定发言者的语音特征,即“语音签名”。
  • 这些语音签名被标记并添加到经过训练的声学和语言模型中,以实现准确的实时标记。
  • 扬声器ID功能适用于新闻、天气和体育直播,提升实时字幕的准确性和清晰度。
  • Verbit总经理Doug Karlovits强调,实时ASR字幕应与人工字幕提供同等清晰度和语境。
  • 该公司提供定制的说话者身份识别选项,以满足客户的具体要求和偏好。
➡️

继续阅读