动态标签与原型分配的超球分类
原文中文,约400字,阅读约需1分钟。发表于: 。通过优化网络参数和原型标签之间的映射关系,我们提出了一种在训练过程中优化每个原型所分配的类别的简单而有效的方法。
该文章介绍了一种简单的方法,通过替换传统的预测规则中的argmax来适应已训练好的模型,从而可靠地预测新类别或提高零样本预测的性能。该方法经过全面的理论分析,研究了学习理论结果、标签空间直径、样本复杂度和模型维度之间的权衡,以及预测未观察到的类别和最新类别选择程序的情境特征。实证研究表明,该方法在ImageNet上相对于SimCLR可获得高达29.7%的相对改进,并可扩展到数十万个类别。当没有可用的度量指标时,该方法可以使用类别嵌入的自主度量,在预训练的零样本模型上获得了10.5%的改进。