本研究提出了TD-EVAL框架,旨在改进任务导向对话系统的评估方法。该框架结合轮次级精确度与对话级比较,能够有效识别传统方法难以捕捉的对话错误,并在与人类评判一致性上优于传统评估,为未来的对话系统评估提供新思路。
本研究提出了LANID框架,旨在解决任务导向对话系统中新意图发现的挑战。该框架通过大型语言模型增强意图发现编码器的语义表示,实验结果表明其在多个数据集上超越了强基准,显示出显著的有效性。
本研究提出GraphTOD框架,旨在解决传统任务导向对话系统对高质量数据集的需求和成本问题。通过用户以JSON格式指定转移图,简化了对话生成过程,显著降低了数据集创建的成本和复杂性。
本研究提出了HierTOD系统,旨在解决复杂企业环境中任务导向对话系统因缺乏标准化文档而面临的挑战。该系统通过分层目标驱动的对话机制,提高了任务完成的主动性和效率,验证了其在信息收集和步骤指导中的有效性。
本文介绍了DiagGPT等大型语言模型在任务导向对话中的应用,强调其在客户服务和医疗领域的潜力。研究表明,这些模型能够有效转化用户意图,并在多代理系统中实现协作。未来,基于大型语言模型的智能代理有望在数字生活中发挥重要作用。
本文研究了任务导向对话系统中的超范围意图识别,提出了DETER框架,利用双编码器和阈值重新分类机制,显著提升了检测性能。同时探讨了大型语言模型在意图分类中的优势与挑战,并提出改进建议。
本文介绍了CI-ToD数据集在任务导向对话系统中解决一致性预测问题的应用。研究表明,现有方法在检测对话不一致性方面仍有提升空间。通过使用大型语言模型和特定组件,提出了提高任务信念跟踪准确率的策略,并探讨了对话系统的设计挑战和持续学习的基准。
本文介绍了SalesBot 2.0,利用大型语言模型缩小闲聊与任务导向对话的差距,构建新数据集以实现更自然的对话。提出的DOCTOR推理框架显著提升了对话质量,并探索了社交对话与任务导向对话的转换,支持商业机会。研究表明,使用新方法开发聊天机器人所需工作量减少,且具备良好的可扩展性。
该文介绍了一种模块化可解释的对话系统,使用大型语言模型、符号规划器和基于代码执行的系统,能够在处理任务导向对话中解决难题,并在协作参考解决任务中表现出显著优势。在最具挑战性的情境中,该系统将任务成功率提高了13个百分点。
介绍了包含16个领域、16000个多领域对话的Schema-Guided Dialogue (SGD)数据集,可用于测试语言理解、位置填充、对话状态跟踪和响应生成等任务。文章提出了基于模式的任务导向对话的范式,支持大量服务形态和新服务的快速集成。
完成下面两步后,将自动完成登录并继续当前操作。