编辑后模型性能下降的原因与解决方案

本文探讨了知识编辑技术在大型语言模型中应用时，编辑后模型性能下降的原因与解决方案。研究首先通过构建多问题数据集（MQD）分析不同编辑数据类型对模型性能的影响，并发现编辑目标的多样性和序列长度是关键因素；随后从模型角度研究影响编辑模型性能的因素，指出编辑模型层的L1范数与编辑准确性之间的强关联。研究提出的Dump for Sequence (D4S)方法有效缓解了编辑瓶颈，降低了模型损伤。

大型语言模型的编辑能力可以纠正错误和更新信息，但在多次编辑中会出现逐渐和灾难性遗忘，限制了其有效性和可扩展性。我们评估了ROME和MEMIT的局限性，并推动以可扩展性为中心的编辑方法的发展。

MEMIT ROME 大型语言模型编辑能力解决方案遗忘