DECIDER: 利用基础模型先验提高模型失败检测和解释能力
原文中文,约500字,阅读约需1分钟。发表于: 。利用大型语言模型和视觉 - 语言模型,我们提出了一个新颖的方法 DECIDER (Debiasing Classifiers to Identify Errors Reliably),用于可靠地检测部署的机器学习模型在给定输入上失败的可能性,并通过测量原始模型和去偏模型之间的不一致性来提供故障检测和可解释的故障解释。
学员分享学习(L2D)旨在改善人工智能协作系统,通过学习如何将决策推迟到人类在更可能比机器学习分类器更准确时。他们提出了成本和能力约束下的推迟框架(DeCCaF),通过监督学习建模人类错误的概率,并使用约束编程来最小化错误成本。测试结果表明,DeCCaF在成本敏感型欺诈检测场景中表现显著好,平均减少了8.4%的错误分类成本。