本文介绍了一种新模型,通过自动编码器和生成对抗网络生成伪OOD样本,以提升自然语言理解中的OOD检测性能。研究结合视觉模型和对话代理,提出了多模态对话的改进方法,并探索了上下文感知的意图检测框架,显著提高了F1-ODD分数。此外,评估了大型语言模型在域外意图检测中的能力,并提出了自适应原型伪标记方法,展示了在少样本场景下的有效性。
本文研究了任务导向对话系统中的超范围意图识别,提出了DETER框架,利用双编码器和阈值重新分类机制,显著提升了检测性能。同时探讨了大型语言模型在意图分类中的优势与挑战,并提出改进建议。
该研究提出了一种基于预训练双句编码器的意图检测方法,适用于少样本学习,表现优于全BERT-Large模型。研究团队发布了相关代码和数据集,展示了在多个领域的意图识别中取得的先进成果,并探讨了无监督方法和对比学习在意图分类中的应用,强调了领域适应和数据增强的重要性。
本研究提出了一种新的任务导向对话系统框架,强调对话状态跟踪的可扩展性和知识转移。通过TRADE和DCL等方法解决了连续学习中的遗忘问题,提升了系统在不同领域的性能。实验结果表明,该方法在意图检测和状态跟踪任务中表现优越,推动了对话系统的研究进展。
本研究介绍了多个多语言数据集,包括MASSIVE、MaSS、MLS和SpeechMatrix,涵盖意图检测、语音识别和翻译等任务。这些数据集为自然语言处理和多语言系统的发展提供了重要资源,推动了相关技术的进步。
阿拉伯方言识别任务(NADI)研究表明,阿拉伯语自然语言处理中的方言识别和机器翻译仍面临挑战。NADI通过新数据集和子任务推动研究,参与团队表现不一,需进一步探索。此外,阿拉伯金融自然语言处理任务也提出了多方言意图检测和翻译,以促进银行业应用。
本文介绍了一项用于多语言和跨语言口语数据意图检测的系统性研究,利用新资源MInDS-14,结合机器翻译模型和多语言句子编码器,在多个目标语言中实现了强大的意图检测器,并进行了比较分析。这是在更广泛的语言范围内开发和评估多语意图检测器的重要一步。
本文评估了大规模语言模型在超出预定义领域的意图检测任务中的能力。发现LLMs具有强大的零样本和少样本能力,但与使用完整资源进行微调的模型相比仍存在劣势。文章讨论了LLMs面临的挑战,并提出了对未来工作的指导。
本文介绍了Dirichlet连续学习(DCL)方法,用于解决对话系统中的计算约束和耗时问题。DCL利用Dirichlet分布建模先验变量,指导伪样本生成,并引入Jensen-Shannon知识蒸馏方法。实验证实了该方法在意图检测和槽填充任务上的有效性,超过了最先进的方法。
本论文介绍了ArBanking77数据集,用于银行领域的意图检测。数据集包含31,404个阿拉伯语查询,每个查询被分类为77个意图。作者提出了基于AraBERT的神经模型,在数据集上获得了高F1分数。数据集和模型可在链接处获取。
本文提出了一种名为Dirichlet连续学习(DCL)的生成排练策略,用于解决数据驱动任务导向对话系统中的增量学习问题。DCL利用Dirichlet分布建模潜在先验变量,指导伪样本的生成。同时,介绍了一种基于逻辑的知识蒸馏方法,称为Jensen-Shannon知识蒸馏(JSKD),在伪样本生成期间增强了知识传递。实验证实了该方法在意图检测和槽填充任务上的有效性,并胜过了最先进的方法。
完成下面两步后,将自动完成登录并继续当前操作。