AdaDistill:用于深度人脸识别的自适应知识蒸馏
原文中文,约300字,阅读约需1分钟。发表于: 。使用自适应知识蒸馏方法 AdaDistill 在深度人脸识别中,通过利用高性能教师模型的知识来提高紧凑学生模型的性能。AdaDistill 将知识蒸馏概念嵌入到带有蒸馏类中心的边际惩罚 softmax 损失中,通过在训练迭代中控制学生的学习能力进展来相对调整蒸馏的知识,无需调整任何超参数。大量实验证明了 AdaDistill...
AdaDistill是一种自适应知识蒸馏方法,提高深度人脸识别学生模型性能。通过控制学生的学习能力进展,增强学生的判别学习能力,并在多个基准测试中展示优越性。