机器之心 ·

NeurIPS 2024 | Unlocking New Pathways for Knowledge Memory Editing in Large Models: Zhejiang University Uses 'WISE' to Combat Hallucinations

💡 原文日文，约5600字，阅读约需14分钟。

📝

内容提要

AIxiv专栏促进了学术交流，报道了2000多篇内容。研究提出了一种基于双重记忆机制的知识编辑方法WISE，旨在提升大模型的知识更新能力，解决机器记忆灵活性不足的问题。该方法结合长期和工作记忆，能够有效进行数千次编辑，提高模型的可靠性和泛化能力。

🎯

🔎

当前大模型在知识更新方面面临显著挑战，主要体现在灵活性和可控性不足。与人类大脑的适应性记忆机制相比，机器记忆的固定性使得在动态环境中进行有效的知识编辑变得困难。这种局限性可能导致模型输出不准确，甚至产生幻觉现象，影响其在实际应用中的可靠性。

WISE方法通过双重记忆机制，结合长期和工作记忆，提供了一种新的知识编辑思路。它不仅能有效进行数千次编辑，还能在保持模型通用能力的同时，解决知识冲突问题。这种创新设计为大模型的持续更新提供了新的可能性，尤其在处理复杂任务时展现出优异的性能。

未来的研究可以集中在优化WISE的路由策略和提升侧记忆的检索效率上。此外，探索更好的记忆架构将有助于应对更复杂的知识编辑场景。这些研究不仅能进一步提升大模型的知识处理能力，还能促进对其内部机制的深入理解，为实现通用人工智能奠定基础。

❓

WISE方法旨在提升大模型的知识更新能力，解决机器记忆灵活性不足的问题。

WISE结合了参数化的长期记忆和工作记忆，通过主记忆存储预训练知识，侧记忆存储编辑后的知识。

现有大模型缺乏灵活性和可控性，难以在动态环境中有效更新知识，常导致输出不准确或幻觉现象。

实验结果表明，WISE在多个任务上表现优异，能够有效解决模型冲突问题，展示了良好的稳定性和扩展性。

未来研究可优化路由策略，提升侧记忆的检索效率，并探索更好的记忆架构以应对复杂的编辑场景。

大模型知识编辑技术的突破对确保模型的可信与安全至关重要，能够促进新知识的快速习得和问题的及时干预。

🏷️