IndoToD: 一个用于端到端任务导向对话系统的多领域印尼语基准数据集
原文中文,约400字,阅读约需1分钟。发表于: 。这篇论文介绍了一个名为 IndoToD 的端到端多领域任务导向对话系统基准,用于印尼语。作者通过将两个英语 ToD 数据集转换为印尼语,并通过去成分化来减小注解的规模,提供了一个高质量的数据集。这个基准可以用于评估印尼语和英语 ToD 系统,同时探索跨语言和双语传递学习方法的潜在益处。
本文介绍了多语言任务导向对话(ToD)数据集的现状和限制,并推出了一个创新的多语言、多领域、多平行 ToD 数据集 Multi3WOZ,以便训练和评估多语言和跨语言的 ToD 系统。该数据集具有大规模、文化适应性强等特点,并提供了不同 ToD 相关任务的基准分数。