UNO-DST: 利用无标签数据进行零样本对话状态跟踪

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究通过联合和自我训练方法,将零样本对话状态跟踪转化为少样本对话状态跟踪,利用目标域中的无标签数据,有效提高了对话状态跟踪模型的训练和微调,在 MultiWOZ 的所有领域中,平均联合目标准确率提高了 8%。

🎯

关键要点

  • 研究通过联合和自我训练方法,将零样本对话状态跟踪转化为少样本对话状态跟踪。
  • 利用目标域中的无标签数据,提高对话状态跟踪模型的训练和微调效果。
  • 辅助任务生成槽类型作为主要任务的逆提示,在联合训练期间创建槽值。
  • 循环一致性使得能够生成和选择未知目标域中的高质量样本,以进行后续微调。
  • 该方法有助于自动标签创建,优化对话状态跟踪模型的训练和微调。
  • 在零样本场景中的大型语言模型上展示了该方法的有效性。
  • 在 MultiWOZ 的所有领域中,平均联合目标准确率提高了 8%。
➡️

继续阅读