跨任务知识蒸é¦çš„投影å¦ä¹
通过使用反向投影的简单修改,我们提出了一种针对跨任务设置的知识蒸馏方法,能够有效处理不同任务之间的教师和学生模型,在没有额外成本的情况下,在跨任务设置下相比传统投影获得了高达 1.9%的改进。此外,我们还使用反向投影进行了分析,提出了一种新的正则化损失函数,使得在 ImageNet 上的无教师蒸馏性能提升高达 8.57%,且无需额外的训练成本。
研究发现,添加投影器可以提高知识蒸馏的性能,改善逻辑蒸馏。具有投影器的学生在训练和测试精度之间取得更好的平衡,与老师的相似性更好,并避免了测试阶段老师的过度自信。基于投影器集合的特征蒸馏方法进一步提高了蒸馏性能。实证结果显示该方法在师生对上具有优越的分类性能,并验证了学生特征的质量改进。