基于RNN-转导器的嘈杂目标语音识别损失函数
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究提出了一种新型损失函数,Target-Robust损失,旨在提升语音识别系统在嘈杂环境下的表现,显著提高RNN-T模型的鲁棒性,恢复超过70%的识别质量。
🎯
关键要点
- 本研究提出了一种新型损失函数,Target-Robust损失。
- 该损失函数旨在提升语音识别系统在嘈杂环境下的表现。
- Target-Robust损失显著提高了RNN-T模型的鲁棒性。
- 研究发现恢复了超过70%的识别质量。
- 该模型在嘈杂数据上的性能优于准确转录的数据。
➡️