本研究提出了TD-EVAL框架,旨在改进任务导向对话系统的评估方法。该框架结合轮次级精确度与对话级比较,能够有效识别传统方法难以捕捉的对话错误,并在与人类评判一致性上优于传统评估,为未来的对话系统评估提供新思路。
本研究提出了LANID框架,旨在解决任务导向对话系统中新意图发现的挑战。该框架通过大型语言模型增强意图发现编码器的语义表示,实验结果表明其在多个数据集上超越了强基准,显示出显著的有效性。
本研究提出GraphTOD框架,旨在解决传统任务导向对话系统对高质量数据集的需求和成本问题。通过用户以JSON格式指定转移图,简化了对话生成过程,显著降低了数据集创建的成本和复杂性。
该文介绍了一种模块化可解释的对话系统,使用大型语言模型、符号规划器和基于代码执行的系统,能够在处理任务导向对话中解决难题,并在协作参考解决任务中表现出显著优势。在最具挑战性的情境中,该系统将任务成功率提高了13个百分点。
介绍了包含16个领域、16000个多领域对话的Schema-Guided Dialogue (SGD)数据集,可用于测试语言理解、位置填充、对话状态跟踪和响应生成等任务。文章提出了基于模式的任务导向对话的范式,支持大量服务形态和新服务的快速集成。
完成下面两步后,将自动完成登录并继续当前操作。