语言模型中虚构知识的学习与遗忘

💡 原文中文,约2100字,阅读约需5分钟。
📝

内容提要

本文研究了大型语言模型(LLMs)在事实知识记忆方面的表现,发现检索增强的模型显著提升了性能。分析不同扩展技术后,揭示了模型规模对事实回忆和上下文学习的影响。此外,研究探讨了LLMs在知识冲突时的行为及其对事实知识的理解能力,指出模型在记忆低频事实时存在困难。这些发现为LLMs的进一步开发提供了重要参考。

🎯

关键要点

  • 本文通过在PopQA数据集上对10个模型和4种增强方法进行实验,研究大型语言模型在记忆事实知识方面的表现。
  • 检索增强的模型在不需要检索的情况下显著改善了性能,并降低了推理成本。
  • 研究发现LLMs在遇到知识冲突时能够接受外部证据,但在提供一致信息时表现出确认偏差。
  • 参数扩展对大型语言模型的核心能力有显著影响,模型规模的减少会降低事实回忆能力,但对上下文处理能力影响较小。
  • 研究表明,预训练数据量的增加并不显著提高模型的事实知识获取能力,且重复训练数据会加速遗忘。
  • LLMs在记忆低频事实时存在困难,更关注频繁和困难的事实,后续事实可能覆盖先前的记忆。
  • 研究揭示了LLMs的事实知识容量与模型规模和训练周期之间的关系,并指出在普通预训练设置下,记忆全部公共事实几乎不切实际。

延伸问答

大型语言模型在记忆事实知识方面的表现如何?

大型语言模型在记忆事实知识方面表现不一,检索增强的模型显著提升了性能,但在记忆低频事实时存在困难。

检索增强的模型有什么优势?

检索增强的模型在不需要检索的情况下显著改善了性能,并降低了推理成本。

模型规模对事实回忆能力的影响是什么?

模型规模的减少会显著降低事实回忆能力,但对上下文处理能力影响较小。

预训练数据量的增加对模型的影响如何?

预训练数据量的增加并不显著提高模型的事实知识获取能力,且重复训练数据会加速遗忘。

大型语言模型在知识冲突时的行为是什么?

在知识冲突时,LLMs能够接受外部证据,但在提供一致信息时表现出确认偏差。

如何评估大型语言模型的事实知识能力?

可以通过知识探测框架和多样的提示数据集来评估大型语言模型的事实知识能力。

➡️

继续阅读