多目标学习延迟问题的统一后处理框架
原文中文,约500字,阅读约需1分钟。发表于: 。通过使用 d-GNP 推广到 Neyman 和 Pearson 的基本引理,我们在不同的约束条件下获得了学习推迟系统的贝叶斯最优解,并设计出了一种通用算法来估计该解,并将该算法应用于 COMPAS 和 ACSIncome 数据集,我们的算法在约束违规方面显示出了改进。
学员分享学习(L2D)旨在改善人工智能协作系统,通过学习如何将决策推迟到人类在更可能比机器学习分类器更准确时。他们提出了成本和能力约束下的推迟框架(DeCCaF),通过监督学习建模人类错误的概率,并使用约束编程来全局最小化错误成本。测试结果表明,DeCCaF在成本敏感型欺诈检测场景中表现显著好,平均减少了8.4%的错误分类成本。