Adaptive Scoring and Thresholding with Human Feedback for Robust Out-of-Distribution Detection

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种基于人类反馈的自适应评分与阈值设定框架,旨在提高机器学习模型在分布外输入(OOD)检测中的安全性。该方法动态更新评分函数,确保高真正阳性率(TPR)和低假阳性率(FPR),在OpenOOD基准上优于现有技术。

🎯

关键要点

  • 本研究提出了一种基于人类反馈的自适应评分与阈值设定框架,旨在提高机器学习模型在分布外输入(OOD)检测中的安全性。
  • 该方法动态更新评分函数,确保高真正阳性率(TPR)和低假阳性率(FPR)。
  • 研究表明,该方法在OpenOOD基准上优于现有技术,成功实现了更高的TPR和FPR控制。
➡️

继续阅读