小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了多模态持续指令调优中的遗忘问题,提出了表层遗忘与基础遗忘的分类。通过答案样式多样化(ASD)和RegLoRA正则化技术,有效避免表层遗忘,提升模型在新任务学习中的表现。

SEFE: Superficial and Essential Forgetting Eliminator for Multimodal Continual Instruction Tuning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z

本文探讨了联邦持续学习中的遗忘问题,提出在数据或任务不相关时,准确遗忘某些信息可以提升学习效果。通过引入“准确遗忘”概念,并基于生成重放的方法,定量评估先前知识的可信度,实验结果表明该方法优于基准模型。

异构联邦持续学习中的准确遗忘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究探讨了垂直联邦学习中的遗忘问题,提出了VFU-KD和VFU-GA方法,通过知识蒸馏和梯度上升实现遗忘,实验结果表明其优于重新训练,具有实用价值。

Forgetting Clients, Features, and Samples in Vertical Federated Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

该研究针对多模态推荐模型中的表示不匹配和遗忘问题,提出了一种定制化训练方法,显著提升了推荐系统的性能和用户体验。

QARM:快手的定量对齐多模态推荐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究提出了一种名为packetLSTM的动态LSTM方法,旨在针对流数据中的变化输入特征空间进行在线学习。该方法为每个输入特征设置专门的LSTM,并利用共享的全局内存,持续学习以缓解遗忘问题。packetLSTM在五个数据集上表现优异,且可扩展至其他RNN类型。

packetLSTM:用于具有变化特征空间的流数据的动态LSTM框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-22T00:00:00Z

本研究提出一种新方法,通过调整训练权重和改变梯度方向,减少类增量学习中敏感群体的遗忘问题,提升群体公平性。实验表明,该方法在真实数据集上比现有方法更好地平衡准确性和公平性。

使用样本加权的公平类增量学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

研究发现,使用简单组件和平衡的损失函数组合可以解决神经网络在新任务上的遗忘问题,并通过正则化程序改进了类增量学习的性能。在CIFAR-100和ImageNet上取得了国际领先的成果。

多功能增量学习:面向类和领域无关的增量学ä¹

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

研究发现,使用简单组件和平衡的损失函数组合可以解决神经网络在新任务上的遗忘问题,并通过正则化程序改进了类增量学习的性能。在CIFAR-100和ImageNet上取得了国际领先的成果。

类增量学习的联合输入输出协调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

本研究通过引入替代经验重放(AER)和不对称平衡采样(ABS),解决了增量训练中的遗忘问题,提升了样本纯度和准确率。

愿遗忘与你同在:用于学习带噪标签的替代重放

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

通过对比KAN和MLP模型在各种任务中的性能,发现MLP通常优于KAN,尤其是在符号公式表示任务中。研究发现,KAN的优势主要来自其B样条激活函数,当B样条应用于MLP时,性能显著提高。然而,在其他任务中,B样条并没有显著提升MLP的性能。此外,在增量式持续学习环境中,KAN的遗忘问题比MLP更严重。这些结果为KAN和其他MLP替代方案的未来研究提供了启示。

KAN 或 MLP:公平比较

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z

研究发现带有LoRA的细调预训练语言模型存在遗忘问题,遗忘量与参数数量和更新步数呈移位幂律增长。无法通过停止或调整参数数量来避免遗忘。这为减轻遗忘问题的细调方案开辟了安全关键方向。

通过指令向量进行大规模语言模型精调的可解释性灾难性遗忘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-18T00:00:00Z

研究发现,使用简单组件和平衡的损失函数组合可以解决神经网络在新任务上的遗忘问题,并通过正则化程序改进了类增量学习的性能。在CIFAR-100和ImageNet上取得了国际领先的成果。

用模型遗忘方法提升生成式类增量学习性能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-27T00:00:00Z

研究发现带有LoRA的细调预训练语言模型存在遗忘问题,遗忘量与参数数量和更新步数呈移位幂律增长。无法通过停止或调整参数数量来避免遗忘。这为减轻遗忘问题的细调方案提供了重要方向。

微调强化学习模型其实是一种遗忘缓解问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-05T00:00:00Z

通过比较决策Transformer(DT)和基于演员-评论者结构与经验回放的现有方法,研究发现DT在学习效率、分布转移缓解和零-shot泛化方面具有优势,但在监督参数更新时会加剧遗忘问题。引入多头DT(MH-DT)和低秩自适应DT(LoRA-DT)以减轻遗忘问题。实验结果表明,该方法在增强学习能力和内存效率方面优于现有的CORL基准。

使用决策 Transformer 解决持续离线强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-16T00:00:00Z

研究发现,细调预训练语言模型存在遗忘问题,特别是带有Low-Rank Adapters的模型。遗忘量与细调参数数量和更新步数呈移位幂律增长。无法通过提前停止或调整参数数量来避免遗忘问题。这为减轻遗忘问题的细调方案提供了重要的安全关键方向。

大型语言模型微调遗忘的缩放律

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-11T00:00:00Z

该研究探讨了深度神经网络的训练和网络参数之间的复杂动力学关系,发现训练网络往往沿着单一方向进行训练,被称为漂移模式。通过损失函数的二次势模型,解释了这种漂移模式,并提出其向潜在值的指数级缓慢衰减。通过奇异值分解,对权重矩阵进行了分解,以实用的方式识别 Hessian 内的关键方向,同时考虑其大小和曲率。最后,提出了一种有效的策略来缓解神经网络在学习新任务时遗忘之前任务知识的挑战。

神经网络权重矩阵的 Hessian 特征向量和主成分分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-01T00:00:00Z

该文章介绍了一种新的持续文本分类方法 InfoCL,通过快慢对比学习和当前-过去对比学习来进行互信息最大化,有效地减轻了遗忘问题,并在三个文本分类任务上达到了最先进的性能。

信息论视角下缓解连续文本分类中的灾难性遗忘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z

本文研究了神经网络持续学习中的遗忘问题,提出了遗忘优先微调和$k$-FPF两种方法,能显著提高效果并降低计算成本。实验表明$k$-FPF进一步提高了效率而不降低准确性。

块状化:即使不更改任务,在连续学习中遗忘也很重要

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-03T00:00:00Z

本研究提出了一种名为 elephant 激活函数的新类别的激活函数,它能够生成稀疏表示和稀疏梯度,通过用 elephant 激活函数替换传统激活函数,可以显著提高神经网络对遗忘的韧性。该方法在回归、类递增学习和强化学习任务中都具有广泛的适用性和益处。

大象神经网络:天生的持续学习耠

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-02T00:00:00Z

本文提出了一种针对无监督在线持续学习的新方法,通过对比学习增强内存使用,使用流依赖的数据增强及实现技巧,解决了持续学习中的遗忘问题,实现了与有监督方法相媲美的最新结果,为持续学习提供了有希望的策略。

领域感知增强对无监督在线通用连续学习的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码