基于评分规则最小化的概率自监督学习

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本文介绍了一种新型的概率自监督学习方法ProSMIN,通过Scoring Rule Minimization来增强表示质量和减少崩溃表示。该方法利用两个神经网络协作学习彼此的多样表示分布,并通过知识蒸馏训练在线网络预测目标网络的表示。ProSMIN在大规模数据集上的下游任务中表现出卓越的能力,证明了其可伸缩性和实际适用性。

🎯

关键要点

  • 提出了一种新型概率自监督学习方法ProSMIN。
  • ProSMIN通过Scoring Rule Minimization增强表示质量和减少崩溃表示。
  • 该方法利用两个神经网络(在线网络和目标网络)协作学习多样表示分布。
  • 通过知识蒸馏训练在线网络预测目标网络的表示。
  • 使用新损失函数基于适当评分规则进行训练。
  • 为ProSMIN的收敛提供了理论证明,验证了优化过程。
  • 在大规模数据集(如ImageNet-O和ImageNet-C)上评估了ProSMIN的性能。
  • ProSMIN在精度和校准方面表现卓越,超越自监督基线。
  • 广泛实验证明了ProSMIN的可伸缩性和实际适用性。
➡️

继续阅读