小红花·文摘

本文探讨大型语言模型（LLMs）在知识边界外产生虚假输出的问题，提出了明确知识边界建模（EKBM）框架，以提升模型在对话状态跟踪任务中的可靠性与准确性。

Enhancing the Reliability of Large Language Models through Explicit Knowledge Boundary Modeling

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，通过指令微调和高级提示策略，提升对话状态跟踪性能，采用变分图自编码器建模用户意图，且无需预定义本体，在开放领域对话中表现优异。

Goal-Oriented Dialogue State Tracking Beyond Ontology

BriefGPT - AI 论文速递 ·

该研究探讨了多任务神经网络在对话系统中的应用，提出了数据增强、错误校正和模型预训练等方法，以提高自动语音识别（ASR）和对话状态跟踪（DST）的性能。实验结果表明，这些方法显著提升了虚拟助手的稳定性和鲁棒性。

关键词感知的自动语音识别错误增强以提高对话状态跟踪的鲁棒性

BriefGPT - AI 论文速递 ·

本文介绍了一种基于深度学习的多领域对话状态跟踪方法，强调其可扩展性和跨领域适应能力。研究提出了TRADE和NADST等新框架，利用预训练模型和零样本学习提高对话状态跟踪的准确性和效率。实验结果表明，这些方法在多个数据集上表现优异，显著提升了对话系统的性能。

推理是你所需要的一切：用于跨领域对话状态跟踪的自我示例检索器与ChatGPT

BriefGPT - AI 论文速递 ·

本研究提出了一种新的任务导向对话系统框架，利用对话状态跟踪器实现跨领域知识转移，解决灾难性遗忘问题。通过TRADE和ARPER等方法提升了对话系统的性能和准确度，展示了通用模型在动态对话状态跟踪中的潜力。

TaSL：通过任务技能定位和整合进行持续对话状态跟踪

BriefGPT - AI 论文速递 ·

APE：主动提示工程 - 识别大型语言模型的有效少量示例

Apple Machine Learning Research ·

本文介绍了TransferQA，一个结合抽取式和多选式问答的生成式模型，提升了零样本对话状态跟踪的性能。通过负面问题抽样和上下文截断等方法，实验证明在MultiWOZ数据集上显著改善了分类和非分类插槽的处理能力，展现了更好的泛化能力。

零射击跨领域对话状态跟踪通过双重低秩适应

BriefGPT - AI 论文速递 ·

本研究探讨了对齐方法在不同情境下的表现，发现小规模训练数据在数学问题解决中效果最佳。提出了长期记忆对话（LeMon）任务，并构建了具长期记忆机制的对话生成框架PLATO-LTM，显著提升了对话一致性。此外，研究了基于大型语言模型的对话状态跟踪和记忆管理，提出了逐步DPO方法，提升了模型性能。

基于 sLLM 的高效准确可记忆对话模型

BriefGPT - AI 论文速递 ·

本文评估了ChatGPT在对话状态跟踪（DST）任务中的表现，并提出了基于小型开源模型的LDST框架，显著提升了零样本和少样本设置下的性能。研究发现，ChatGPT在多轮交互中表现良好，但在语音理解任务中存在困难。通过改进方法，提升了大型语言模型在任务导向对话中的效果，并在多个数据集上取得了优异结果。

使用 GPT-4 的二维零样本对话状态跟踪评估方法

BriefGPT - AI 论文速递 ·

本文探讨了零样本迁移学习在多域对话状态跟踪中的应用，提出通过合成域内数据来提高模型准确性。研究表明，利用大型语言模型生成自然对话并结合无标签数据进行训练，能显著提升零样本学习效果，平均准确率提高8%。在MultiWOZ2.1数据集上，提出的方法表现出色，推动了对话状态跟踪技术的发展。

利用多样数据生成实现可调适的零样本对话状态追踪

BriefGPT - AI 论文速递 ·

本文介绍了多种任务导向对话系统的研究进展，包括神经模块化对话生成器、PPTOD模型解决级联生成问题，以及结合任务导向与开放领域对话的统一模型PivotBot。这些模型在对话状态跟踪和响应生成方面表现出色，取得了先进的性能。

众工合力：面向任务的模块化专家混合对话系统

BriefGPT - AI 论文速递 ·

本文探讨了半监督学习在神经对话系统中的应用，利用未标注数据减少对话状态注释需求，并提出了端到端对话模型。研究表明，大型语言模型在多轮任务中的表现优于专门模型，通过无监督方法识别槽位模式显著提升了对话状态跟踪和响应生成的效果。

嘈杂信道的力量：无监督端到端任务导向对话的 LLMs

BriefGPT - AI 论文速递 ·

本文介绍了多种对话状态跟踪（DST）方法，如对话状态蒸馏网络（DSDN）和DiCoS-DST，强调动态利用对话状态和插槽更新关系。这些方法在多个数据集上表现优异，提升了跨领域的可扩展性和准确性，为任务导向对话系统提供了有效的设计指导。

对话状态跟踪的思维链解释

BriefGPT - AI 论文速递 ·

介绍了Schema-Guided Dialogue (SGD)数据集，包括16个领域的16,000个多领域对话。SGD数据集是一个具有挑战性的测试平台，用于测试语言理解、位置填充、对话状态跟踪和响应生成。提出了基于模式的任务导向对话的范式，提高了对不同服务形态和新服务的支持和集成。

WEBDial，一种多领域、多任务的统计对话框架与 RDF

BriefGPT - AI 论文速递 ·

该文提出了一种新颖的逐轮主动学习框架，用于对话状态跟踪。通过主动选择对话中的轮次进行注释，解决了收集大量逐轮标注对话数据的高成本和低效率问题。实验结果表明选择性注释对话轮次的有效性，同时使用显著较少的标注数据，可以实现与传统训练方法相当的DST性能，为注释新的对话数据提供了更高效的方式。

对话状态跟踪的转折级主动学习

BriefGPT - AI 论文速递 ·

介绍了包含16个领域、16000个多领域对话的Schema-Guided Dialogue (SGD)数据集，可用于测试语言理解、位置填充、对话状态跟踪和响应生成等任务。文章提出了基于模式的任务导向对话的范式，支持大量服务形态和新服务的快速集成。

DemoSG: 低资源事件提取的展示增强模式引导生成

BriefGPT - AI 论文速递 ·

该研究通过联合和自我训练方法，将零样本对话状态跟踪转化为少样本对话状态跟踪，利用目标域中的无标签数据，有效提高了对话状态跟踪模型的训练和微调，在 MultiWOZ 的所有领域中，平均联合目标准确率提高了 8%。

UNO-DST: 利用无标签数据进行零样本对话状态跟踪

BriefGPT - AI 论文速递 ·