在大型语言模型时代的意图检测

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

检测任务导向对话中的超范围用户话语很重要。我们提出了DETER框架,使用双编码器生成用户话语嵌入,并通过神经网络进行分类。DETER结合自我监督生成异常值和开放域数据集短语,确保全面训练。基于阈值的重新分类机制细化预测。在多个数据集上,DETER显著提高了已知和未知意图的F1分数。

🎯

关键要点

  • 检测任务导向对话和意图分类中的超范围用户话语至关重要。
  • 提出了名为DETER的双编码器阈值重新分类的端到端框架。
  • DETER解决了当前方法在处理异常值的不可预测分布上的困难。
  • DETER核心利用双文本编码器生成用户话语嵌入,通过分支神经架构进行分类。
  • 结合自我监督生成合成异常值和开放域数据集的超范围短语,确保全面训练。
  • 基于阈值的重新分类机制细化模型的初始预测。
  • 在多个数据集上评估证明DETER的有效性,F1分数显著提高。
  • CLINC-150和Stackoverflow上的已知和未知意图F1分数分别提高了13%和5%。
  • 在Banking77上已知意图提高了16%,未知意图提高了24%。
  • 源代码已在指定网址发布。
➡️

继续阅读