动态标签与原型分配的超球分类
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文章介绍了一种简单的方法,通过替换传统的预测规则中的argmax来适应已训练好的模型,从而可靠地预测新类别或提高零样本预测的性能。该方法经过全面的理论分析,研究了学习理论结果、标签空间直径、样本复杂度和模型维度之间的权衡,以及预测未观察到的类别和最新类别选择程序的情境特征。实证研究表明,该方法在ImageNet上相对于SimCLR可获得高达29.7%的相对改进,并可扩展到数十万个类别。当没有可用的度量指标时,该方法可以使用类别嵌入的自主度量,在预训练的零样本模型上获得了10.5%的改进。
🎯
关键要点
-
提出了一种简单的方法,通过替换传统的预测规则中的argmax来适应已训练好的模型。
-
该方法可以可靠地预测新类别或提高零样本预测的性能,无需额外的训练。
-
进行了全面的理论分析,研究了学习理论结果、标签空间直径、样本复杂度和模型维度之间的权衡。
-
探讨了预测未观察到的类别的情境特征和最新类别选择程序。
-
实证研究表明,该方法Loki在ImageNet上相对于SimCLR可获得高达29.7%的相对改进。
-
该方法可扩展到数十万个类别。
-
在没有可用的度量指标时,Loki可以使用类别嵌入的自主度量,获得10.5%的改进。
➡️