动态标签与原型分配的超球分类

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文章介绍了一种简单的方法,通过替换传统的预测规则中的argmax来适应已训练好的模型,从而可靠地预测新类别或提高零样本预测的性能。该方法经过全面的理论分析,研究了学习理论结果、标签空间直径、样本复杂度和模型维度之间的权衡,以及预测未观察到的类别和最新类别选择程序的情境特征。实证研究表明,该方法在ImageNet上相对于SimCLR可获得高达29.7%的相对改进,并可扩展到数十万个类别。当没有可用的度量指标时,该方法可以使用类别嵌入的自主度量,在预训练的零样本模型上获得了10.5%的改进。

🎯

关键要点

  • 提出了一种简单的方法,通过替换传统的预测规则中的argmax来适应已训练好的模型。

  • 该方法可以可靠地预测新类别或提高零样本预测的性能,无需额外的训练。

  • 进行了全面的理论分析,研究了学习理论结果、标签空间直径、样本复杂度和模型维度之间的权衡。

  • 探讨了预测未观察到的类别的情境特征和最新类别选择程序。

  • 实证研究表明,该方法Loki在ImageNet上相对于SimCLR可获得高达29.7%的相对改进。

  • 该方法可扩展到数十万个类别。

  • 在没有可用的度量指标时,Loki可以使用类别嵌入的自主度量,获得10.5%的改进。

➡️

继续阅读