本文探讨了上下文学习中的知识劫持机制,分析了token预测中上下文信息与预训练知识的平衡。研究表明,结合两层变换器的诱导头机制与关联记忆,可以优化ICL的潜力。
本文介绍了一种名为标签退火的方法,用于在微调大型语言模型时减少知识遗忘。该方法通过在损失函数中添加KL散度项,帮助模型在微调过程中保留预训练知识,提升数学和编码领域的表现,同时保持其他能力。标签退火在对齐微调中实现了指令遵循能力与预训练知识之间的平衡。
本文提出了一个多模态讽刺目标识别框架,通过推理和预训练知识增强讽刺可解释性。实验结果表明,该模型在识别讽刺方面具有解释性。
本研究评估了使用基础模型的预训练知识作为FL模型初始化的教师对FL模型性能的影响。结果显示,在胸部X光肺分割任务中,FL模型初始化指导下的FL能更快收敛,并在复杂数据情境中提高性能。为FL中的模型初始化提供了新的视角。
完成下面两步后,将自动完成登录并继续当前操作。