BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

跨任务知识蒸馏的投影学ä¹

通过使用反向投影的简单修改,我们提出了一种针对跨任务设置的知识蒸馏方法,能够有效处理不同任务之间的教师和学生模型,在没有额外成本的情况下,在跨任务设置下相比传统投影获得了高达 1.9%的改进。此外,我们还使用反向投影进行了分析,提出了一种新的正则化损失函数,使得在 ImageNet 上的无教师蒸馏性能提升高达 8.57%,且无需额外的训练成本。

研究发现,添加投影器可以提高知识蒸馏的性能,改善逻辑蒸馏。具有投影器的学生在训练和测试精度之间取得更好的平衡,与老师的相似性更好,并避免了测试阶段老师的过度自信。基于投影器集合的特征蒸馏方法进一步提高了蒸馏性能。实证结果显示该方法在师生对上具有优越的分类性能,并验证了学生特征的质量改进。

投影器 测试精度 知识蒸馏 训练精度 逻辑蒸馏

相关推荐 去reddit讨论

热榜 Top10

eolink
eolink
观测云
观测云
Dify.AI
Dify.AI
LigaAI
LigaAI

推荐或自荐