💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
播客已成为重要的故事、新闻和娱乐媒介,但缺乏文字稿使听障人士难以获取内容。确保自动生成的播客文字稿可读且准确是一大挑战。我们使用自动语音识别模型转录苹果播客目录中的数百万集播客,并通过与少量人工生成的文字稿进行比较来评估其质量。
🎯
关键要点
- 播客已成为重要的故事、新闻和娱乐媒介。
- 缺乏文字稿使听障人士难以获取内容。
- 确保自动生成的播客文字稿可读且准确是一大挑战。
- 文字稿需要准确反映所说内容的意思,并且易于阅读。
- 我们使用自动语音识别模型转录苹果播客目录中的数百万集播客。
- 通过与少量人工生成的文字稿进行比较来评估ASR输出的质量。
➡️