BriefGPT - AI 论文速递 ·

众工合力：面向任务的模块化专家混合对话系统

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了多种任务导向对话系统的研究进展，包括神经模块化对话生成器、PPTOD模型解决级联生成问题，以及结合任务导向与开放领域对话的统一模型PivotBot。这些模型在对话状态跟踪和响应生成方面表现出色，取得了先进的性能。

🎯

采用神经模块化方法，提出一种多专家一体的对话生成器，具有更高的 inform 和 success rate。
通过 PPTOD 模型和新的对话多任务预训练策略解决任务导向对话系统中的级联生成问题，取得最新成果。
研究将任务定向对话和有知识的聊天整合到单个模型中，创建 KETOD 数据集，提出 SimpleToDPlus 和 Combiner 模型，表现优越。
基于 Task-Optimized Adapters 和强化学习的 End-to-end TOD 系统在 MultiWOZ 基准测试上表现优越，特别是在 DST 任务上达到了最先进水平。
提出自动生成结合任务导向对话和开放领域对话的框架，介绍统一模型 PivotBot，能够无缝切换两种对话类型。
SimpleTOD 采用单个因果语言模型解决任务导向对话，提升对话状态跟踪的准确性。
提出 Mixture-of-Distilled-Expert (MoDE) 方法，通过专家间的相互蒸馏提高整体性能。
SimpleMTOD 提出了一个简单的语言模型，将多模态任务导向对话的子任务转换为序列预测任务，取得最先进的 BLEU 分数。
利用 MobileCS 中国 TOD 数据集，使用半监督学习和强化学习构建知识引导的对话模型，实现高效预测和人机交互。

❓

神经模块化对话生成器是一种采用神经网络模块化方法的对话系统，能够通过多专家模型提高对话的inform和success rate。

PPTOD模型通过新的对话多任务预训练策略解决了任务导向对话系统中的级联生成问题，取得了最新成果。

PivotBot模型能够无缝切换任务导向对话和开放领域对话，提供了一种自动生成这两种对话类型的框架。

SimpleTOD模型采用单个因果语言模型，利用预训练的开放领域模型进行转移学习，从而提高对话状态跟踪的准确性。

MoDE方法通过专家间的相互蒸馏提高整体性能，使每个专家能够更准确地理解其子任务，从而提升测试性能。

使用MobileCS中国TOD数据集构建的对话模型在自动评估和人工交互中表现优异，特别是在BLEU和Success指标上显著提高。

🏷️