通过噪声表示学习增强对话语音识别的鲁棒上下文感知
原文中文,约200字,阅读约需1分钟。发表于: 。本研究针对自动语音识别(ASR)中因转录错误影响对话系统性能的问题,提出了一种上下文噪声表示学习方法(CNRL)以增强识别的鲁棒性。该方法通过对文本对话数据进行解码器预训练和上下文编码器的噪声表示学习,提高了在噪声环境中对话语音识别的准确性,尤其在用户语音难以听清的情况下表现出色。
本研究提出了一种上下文噪声表示学习方法(CNRL),用于增强在噪声环境中的对话语音识别准确性。该方法通过解码器预训练和上下文编码器的噪声表示学习,特别适用于用户语音难以听清的情况。