本文探讨了Child-Tuning微调技术,通过遮盖非子网络的梯度,提升了模型在GLUE基准测试中的表现,平均提高1.5至8.6分。研究表明,Child-Tuning显著增强了模型在领域转移和任务转移中的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。