小红花·文摘

最近的研究试图通过重新训练开源语言模型来改进其模仿学习能力，但合成数据的噪声会导致低质量的响应和推理。实验证明了虚假指令与基准得分的相关性，并发现语言模型在使用虚假指令训练时会生成虚假答案。恢复模型的原始性能是可能的，但无法完全达到。