小红花·文摘

本研究评估了状态空间模型（SSMs）在语言模型中的信息回忆表现。结果显示，只有变压器和基于SSM的模型在联想记忆任务中表现优异，其他SSMs因机制差异未能成功，强调了机械评估的重要性。

BriefGPT - AI 论文速递 ·

本研究提出了ConceptFormer方法，旨在提高大型语言模型中知识图谱的使用效率。该方法通过将知识图谱信息编码为概念向量，显著提升了GPT-2模型的信息回忆能力，展现出广泛的应用潜力。

BriefGPT - AI 论文速递 ·