在网页噪声数据集中,准确的检测并不是你对抗标签噪声所需的全部

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了使用SupCon方法训练机器学习模型以识别外分布样本的重要性。作者提出了一种全面的方法来学习对OOD数据稳健的分类器,并通过增加对比项来扩展SupCon损失。实验结果表明,该方法在常见基准测试中取得了最先进的结果。

🎯

关键要点

  • 使用SupCon训练机器学习模型以识别外分布样本是安全部署中的重要问题。
  • 提出了一种全面的方法来学习对OOD数据稳健的分类器。
  • 通过增加两个对比项扩展SupCon损失,第一个项将辅助OOD表征与ID表征分开,第二个项将OOD特征远离现有类原型。
  • 提出特征混合技术以高效生成伪OOD特征,当辅助OOD数据不可用时使用。
  • 该解决方案简单高效,是闭集监督对比表征学习的自然扩展。
  • 在常见基准测试中与不同的OOD检测方法比较,展示了最先进的结果。
➡️

继续阅读