多专家延迟回归

💡 原文中文,约500字,阅读约需1分钟。
📝

内容提要

学员分享学习(L2D)旨在改善人工智能协作系统,通过学习如何将决策推迟到人类在更可能比机器学习分类器更准确时。研究提出了成本和能力约束下的推迟框架(DeCCaF),通过监督学习建模人类错误概率,并使用约束编程全局最小化错误成本。测试结果表明,DeCCaF在欺诈检测场景中表现显著好,平均减少了8.4%的错误分类成本。

🎯

关键要点

  • 学员分享学习(L2D)旨在改善人工智能协作系统。
  • L2D研究忽视了成本敏感场景中的类型1和类型2错误的不同成本。
  • 现有研究要求对每个训练数据实例进行并发的人类预测。
  • 未考虑人类工作能力的限制。
  • 提出了成本和能力约束下的推迟框架(DeCCaF)。
  • DeCCaF采用监督学习建模人类错误概率,满足更宽松的数据要求。
  • 使用约束编程在工作负载限制下全局最小化错误成本。
  • 在合成欺诈分析师团队的欺诈检测场景中测试DeCCaF。
  • 测试结果显示DeCCaF在各种场景中表现显著好,平均减少8.4%的错误分类成本。
➡️

继续阅读