小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
语言模型到底能记忆多少内容?Meta 的新框架定义了比特级的模型容量

研究者质疑现代语言模型的记忆行为,提出新方法评估模型对数据点的理解,区分非预期记忆与泛化。实验表明,GPT系列模型的记忆容量约为3.6位/参数,且随着训练集增大,记忆力下降。该研究为理解模型行为提供了框架,推动未来模型评估与隐私研究。

语言模型到底能记忆多少内容?Meta 的新框架定义了比特级的模型容量

实时互动网
实时互动网 · 2025-06-12T02:35:30Z

本文研究了扩散概率生成模型的泛化能力,发现确定性采样器生成的数据与训练集高度相关,导致泛化能力差。通过实验验证了训练模型的微小区别对性能的影响,并提出了新的训练目标以改善泛化能力。此外,研究探讨了模型的记忆行为及其对生成质量的影响,提出了有效的加权策略以解决估计偏差问题,展示了扩散模型在高维数据学习中的优势。

理解扩散模型的泛化能力需要重新思考隐含的高斯结构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本研究探讨了扩散模型的记忆行为及其影响因素,发现数据分布、模型配置和训练过程显著影响模型输出。提出了一种高效的数据归因方法,以提高扩散模型的可解释性和可控性。研究表明,合成数据在分类性能上不如真实数据,扩散模型在复制训练数据分布方面仍需改进。

扩散归因评分:评估训练数据在扩散模型中的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

这篇文章探讨了大型语言模型(LLMs)的记忆行为及其对隐私的影响。研究发现,模型在训练过程中可能记忆个人可识别信息(PII),并在推理中泄露。为减轻隐私风险,建议采用记忆减轻技术,并强调在模型训练中需谨慎处理数据以保护隐私。

揭开潜在记忆:评估大型语言模型中的数据泄露和记忆模式

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

本研究探讨了扩散模型的记忆行为,发现数据分布、模型配置和训练过程对记忆有显著影响。提出了一种新的dropout方法以减少记忆化的准确性,降低泛化差距。同时,研究提出了DEPN框架,用于检测和编辑隐私神经元,显著降低数据泄漏风险。

找到 NeMo: 在扩散模型中定位负责记忆的神经元

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-04T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码