MIDAS:用于多轮自然语言理解的多层意图、领域和槽位知识蒸馏
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一个中文多领域知识驱动会话数据集,包含电影、音乐和旅游三个领域的4.5K个会话。通过引入背景知识可以增强模型,但仍有空间进行进一步研究。不同领域之间存在性能差异,值得探索转移学习和领域适应。该语料库和基准模型是公开可用的。
🎯
关键要点
-
提出了一个中文多领域知识驱动会话数据集,包含电影、音乐和旅游三个领域的4.5K个会话。
-
语料库包含86K个话语,平均轮数为19.0。
-
提供了多个基准模型以促进后续研究。
-
引入背景知识可以增强模型,但仍有进一步研究的空间。
-
不同领域之间存在明显的性能差异,值得探索转移学习和领域适应。
-
该语料库和基准模型是公开可用的。
➡️