在大型语言模型时代的意图检测
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
检测任务导向对话中的超范围用户话语很重要。我们提出了DETER框架,使用双编码器生成用户话语嵌入,并通过神经网络进行分类。DETER结合自我监督生成异常值和开放域数据集短语,确保全面训练。基于阈值的重新分类机制细化预测。在多个数据集上,DETER显著提高了已知和未知意图的F1分数。
🎯
关键要点
- 检测任务导向对话和意图分类中的超范围用户话语至关重要。
- 提出了名为DETER的双编码器阈值重新分类的端到端框架。
- DETER解决了当前方法在处理异常值的不可预测分布上的困难。
- DETER核心利用双文本编码器生成用户话语嵌入,通过分支神经架构进行分类。
- 结合自我监督生成合成异常值和开放域数据集的超范围短语,确保全面训练。
- 基于阈值的重新分类机制细化模型的初始预测。
- 在多个数据集上评估证明DETER的有效性,F1分数显著提高。
- CLINC-150和Stackoverflow上的已知和未知意图F1分数分别提高了13%和5%。
- 在Banking77上已知意图提高了16%,未知意图提高了24%。
- 源代码已在指定网址发布。
➡️