小红花·文摘

本研究探讨了大语言模型（LLMs）在训练中可能出现的记忆现象，导致模型逐字复述训练数据，从而影响数据隐私和知识产权。提出了PEARL方法，通过输入扰动分析检测记忆现象，实验结果表明该方法有效。

Memorization or Interpolation? Detecting Memorization Phenomena in Large Language Models through Input Perturbation Analysis

BriefGPT - AI 论文速递 ·

本研究探讨大型语言模型在代码生成中的记忆现象，指出其在应对编程问题变体时缺乏泛化能力。通过三种演变策略，发现记忆评分与记忆水平相关，常见的缓解方法效果有限，强调需寻找更有效的解决方案。

记忆还是泛化？使用演变问题评估大型语言模型代码生成

BriefGPT - AI 论文速递 ·

本研究探讨大型语言模型的记忆现象及其隐私和安全风险。通过分析记忆与训练时长、数据集规模和样本相似性的关系，提出量化方法，并为降低风险提供理论和实证支持。

大型语言模型中的偏斜记忆：量化与分解

BriefGPT - AI 论文速递 ·

最近的研究发现，文本到图像扩散模型在生成高质量图像方面表现出色，但也引发了对版权侵权和隐私风险的担忧。研究人员通过检查交叉注意力机制与记忆现象的关系，提出了一种新的视角来理解这一现象。他们发现，交叉注意力倾向于过度关注特定标记的嵌入，导致模型过度拟合并记住了训练图像。为了解决这个问题，他们提出了一种创新方法来检测和减轻扩散模型中的记忆现象，同时保持生成图像质量不受影响。

在扩散模型中检测、解释和减轻记忆化

BriefGPT - AI 论文速递 ·

最近的研究发现，文本到图像扩散模型在生成高质量图像方面表现出色，但也引发了版权侵权和隐私风险的担忧。研究人员通过检查交叉注意力机制与记忆现象的关系，提出了一种新的视角来理解这一现象。他们发现交叉注意力倾向于过度关注特定标记的嵌入，导致模型记住了相应的训练图像。为了解决这个问题，他们提出了一种创新方法来检测和减轻扩散模型中的记忆现象，同时保持生成图像质量不受影响。

找到 NeMo: 在扩散模型中定位负责记忆的神经元

BriefGPT - AI 论文速递 ·

最近的研究发现，文本到图像扩散模型在生成高质量图像方面表现出色，但也引发了对版权侵权和隐私风险的担忧。研究人员通过检查交叉注意力机制与记忆现象的关系，提出了一种新的视角来理解这一现象。他们发现交叉注意力倾向于过度关注特定标记的嵌入，导致模型记住了相应的训练图像。为了解决这个问题，他们提出了一种创新方法来检测和减轻扩散模型中的记忆现象，同时保持生成图像质量不受影响。

走向无需记忆的扩散模型

BriefGPT - AI 论文速递 ·