本研究提出了一种基于人类反馈的自适应评分与阈值设定框架,旨在提高机器学习模型在分布外输入(OOD)检测中的安全性。该方法动态更新评分函数,确保高真正阳性率(TPR)和低假阳性率(FPR),在OpenOOD基准上优于现有技术。
本文研究了通过阈值设定解决类别不平衡问题的方法,提出了适用于异常检测的函数阈值概念。研究表明,基于距离的异常点检测可以有效转化为概率估计,并提出了OTLP框架,适用于多种分类问题。实验结果显示,动态自适应阈值策略和新方法在图像分类和异常检测中显著提升了检测性能。
完成下面两步后,将自动完成登录并继续当前操作。