本文探讨大型语言模型(LLMs)在知识边界外产生虚假输出的问题,提出了明确知识边界建模(EKBM)框架,以提升模型在对话状态跟踪任务中的可靠性与准确性。
本研究提出了一种新方法,通过指令微调和高级提示策略,提升对话状态跟踪性能,采用变分图自编码器建模用户意图,且无需预定义本体,在开放领域对话中表现优异。
该研究探讨了多任务神经网络在对话系统中的应用,提出了数据增强、错误校正和模型预训练等方法,以提高自动语音识别(ASR)和对话状态跟踪(DST)的性能。实验结果表明,这些方法显著提升了虚拟助手的稳定性和鲁棒性。
本文介绍了一种基于深度学习的多领域对话状态跟踪方法,强调其可扩展性和跨领域适应能力。研究提出了TRADE和NADST等新框架,利用预训练模型和零样本学习提高对话状态跟踪的准确性和效率。实验结果表明,这些方法在多个数据集上表现优异,显著提升了对话系统的性能。
本研究提出了一种新的任务导向对话系统框架,利用对话状态跟踪器实现跨领域知识转移,解决灾难性遗忘问题。通过TRADE和ARPER等方法提升了对话系统的性能和准确度,展示了通用模型在动态对话状态跟踪中的潜力。
本文介绍了主动提示工程(APE),一种通过人类反馈优化提示的工具,旨在提升大型语言模型(LLMs)的性能。该工具通过选择模糊示例进行反馈,帮助生成有效的少量示例。此外,文章还探讨了在对话状态跟踪中使用合成数据进行少量学习的研究,强调了获取标注训练数据的困难。
本文介绍了TransferQA,一个结合抽取式和多选式问答的生成式模型,提升了零样本对话状态跟踪的性能。通过负面问题抽样和上下文截断等方法,实验证明在MultiWOZ数据集上显著改善了分类和非分类插槽的处理能力,展现了更好的泛化能力。
本研究探讨了对齐方法在不同情境下的表现,发现小规模训练数据在数学问题解决中效果最佳。提出了长期记忆对话(LeMon)任务,并构建了具长期记忆机制的对话生成框架PLATO-LTM,显著提升了对话一致性。此外,研究了基于大型语言模型的对话状态跟踪和记忆管理,提出了逐步DPO方法,提升了模型性能。
介绍了Schema-Guided Dialogue (SGD)数据集,包括16个领域的16,000个多领域对话。SGD数据集是一个具有挑战性的测试平台,用于测试语言理解、位置填充、对话状态跟踪和响应生成。提出了基于模式的任务导向对话的范式,提高了对不同服务形态和新服务的支持和集成。
该文提出了一种新颖的逐轮主动学习框架,用于对话状态跟踪。通过主动选择对话中的轮次进行注释,解决了收集大量逐轮标注对话数据的高成本和低效率问题。实验结果表明选择性注释对话轮次的有效性,同时使用显著较少的标注数据,可以实现与传统训练方法相当的DST性能,为注释新的对话数据提供了更高效的方式。
介绍了包含16个领域、16000个多领域对话的Schema-Guided Dialogue (SGD)数据集,可用于测试语言理解、位置填充、对话状态跟踪和响应生成等任务。文章提出了基于模式的任务导向对话的范式,支持大量服务形态和新服务的快速集成。
该研究通过联合和自我训练方法,将零样本对话状态跟踪转化为少样本对话状态跟踪,利用目标域中的无标签数据,有效提高了对话状态跟踪模型的训练和微调,在 MultiWOZ 的所有领域中,平均联合目标准确率提高了 8%。
完成下面两步后,将自动完成登录并继续当前操作。