本文介绍了一种面向少教师推理知识蒸馏的方法,通过比较式知识蒸馏,学生模型能够理解教师模型对样本解释的微妙差异,并获得额外的学习信号。实验证明,这种方法优于传统的数据增强和知识蒸馏技术。
完成下面两步后,将自动完成登录并继续当前操作。