小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨大型语言模型(LLMs)因记忆训练数据而引发的隐私和版权问题,分析注意力模块对记忆和泛化性能的影响,并提出减少记忆效应的解决方案。

Memory Phenomena in Large Language Models through Model Attribution Analysis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究解决了机器学习模型在处理具有伪相关的样本时测试性能不平衡的问题,特别是少数群体的准确性低下。通过分析记忆现象,本文首次证明记忆在这一不平衡表现中的作用,并提出通过消除不必要的伪记忆模式来改善少数群体的模型表现的新方法。这些发现为神经网络如何编码重要与伪相关知识提供了新视角,并为未来研究奠定了基础。

沉默的多数:揭示伪相关下的记忆效应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-01T00:00:00Z

本研究提出了一种基于内点记忆效应的异常值检测方法,通过增加训练数据尺寸和使用自适应阈值设计截断损失函数,达到了最先进的性能。该方法与隐私保护算法结合展现了良好的鲁棒性。

ALTBI:通过优化内点记忆效应构建改进的异常值检测模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z

神经随机伏特雷方程是具有记忆效应和不规则行为的随机系统的数学模型。研究者提出了基于物理启发的神经随机伏特雷方程,并进行了理论探讨。数值实验展示了神经随机伏特雷方程、神经随机微分方程和深度操作网络的性能。

神经随机 Volterra 方程:学习路径相关动力学

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-28T00:00:00Z

研究发现大语言模型(LLMs)存在记忆化现象,模型大小、连续大小和上下文大小之间存在记忆化关系。通过实验证实了句子的嵌入分布和解码动态,揭示了记忆化和非记忆化句子的边界效应。通过训练Transformer模型预测记忆化,证明了通过上下文预测记忆化的可行性。

量化 LLM 中上下文推理效应和记忆效应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码