关键词感知的自动语音识别错误增强以提高对话状态跟踪的鲁棒性
原文中文,约200字,阅读约需1分钟。发表于: 。本研究针对任务导向对话系统中对话状态跟踪的准确性问题,提出了一种简单而有效的数据增强方法,旨在克服自动语音识别系统引起的命名实体错误。该方法通过关键词高亮提示控制错误位置,引入音素相似的错误,从而在噪声和低准确度的ASR环境中显著提高了DST模型的准确性。
本文介绍了一种名为ASSIST的框架,用于训练从带噪标签中学习的DST模型。ASSIST使用辅助模型生成每个训练样本的伪标签,并将其与带噪标签一起用于训练主模型。实验结果显示,相对于仅使用带噪标签,ASSIST在MultiWOZ 2.0和MultiWOZ 2.4上分别提高了28.16%和8.41%的DST联合目标准确度。