小红花·文摘

本研究探讨了多模态持续指令调优中的遗忘问题，提出了表层遗忘与基础遗忘的分类。通过答案样式多样化（ASD）和RegLoRA正则化技术，有效避免表层遗忘，提升模型在新任务学习中的表现。

SEFE: Superficial and Essential Forgetting Eliminator for Multimodal Continual Instruction Tuning

BriefGPT - AI 论文速递 ·

本文探讨了联邦持续学习中的遗忘问题，提出在数据或任务不相关时，准确遗忘某些信息可以提升学习效果。通过引入“准确遗忘”概念，并基于生成重放的方法，定量评估先前知识的可信度，实验结果表明该方法优于基准模型。

Accurate Forgetting in Heterogeneous Federated Continual Learning

BriefGPT - AI 论文速递 ·

本研究探讨了垂直联邦学习中的遗忘问题，提出了VFU-KD和VFU-GA方法，通过知识蒸馏和梯度上升实现遗忘，实验结果表明其优于重新训练，具有实用价值。

Forgetting Clients, Features, and Samples in Vertical Federated Learning

BriefGPT - AI 论文速递 ·

该研究针对多模态推荐模型中的表示不匹配和遗忘问题，提出了一种定制化训练方法，显著提升了推荐系统的性能和用户体验。

QARM: Quantitative Alignment for Multi-Modal Recommendations at Kuaishou

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的对齐特征隔离方法，旨在解决增量人脸伪造检测中的遗忘问题。通过堆叠旧任务和新任务的特征分布，保护已学习的伪造信息，实验结果验证了该方法的有效性。

Stacking Brick by Brick: Aligned Feature Isolation for Incremental Face Forgery Detection

BriefGPT - AI 论文速递 ·

该研究提出了一种类独立转换（CIT）方法，旨在解决类增量语义分割中学习新类别时避免遗忘旧类别的问题。通过建立累积蒸馏框架，确保所有类别信息的公平融合，实验结果表明在不同数据集上任务遗忘率极低。

Rethinking Class-Incremental Semantic Segmentation with Class Independent Transformation

BriefGPT - AI 论文速递 ·

本研究提出了一种名为packetLSTM的动态LSTM方法，旨在针对流数据中的变化输入特征空间进行在线学习。该方法为每个输入特征设置专门的LSTM，并利用共享的全局内存，持续学习以缓解遗忘问题。packetLSTM在五个数据集上表现优异，且可扩展至其他RNN类型。

packetLSTM：用于具有变化特征空间的流数据的动态LSTM框架

BriefGPT - AI 论文速递 ·

本研究提出一种新方法，通过调整训练权重和改变梯度方向，减少类增量学习中敏感群体的遗忘问题，提升群体公平性。实验表明，该方法在真实数据集上比现有方法更好地平衡准确性和公平性。

使用样本加权的公平类增量学习

BriefGPT - AI 论文速递 ·

本文介绍了一种新型神经网络连续学习算法UCL，解决了正则化方法的主要问题，表现优异。研究了多种持续学习方法及其在视频和图像识别中的应用，提出了有效的遗忘问题解决方案，并展示了新方法在减少遗忘和提高准确率方面的优势。

连续人类姿态估计以增量整合关键点和姿态变化

BriefGPT - AI 论文速递 ·

本文研究了持续学习中的任务增量分类方法，提出了一种新的框架以平衡稳定性与可塑性。通过多个基准测试，比较了11种持续学习方法，并提出了解决遗忘问题的方案，如任务无关表示巩固（TARC）和有监督对比学习框架，展示了其在不同学习场景中的有效性和优越性。

基于任务专家的持续学习

BriefGPT - AI 论文速递 ·

本文探讨了多模型和多级别知识蒸馏策略，以提升持续学习中的性能并解决旧类知识遗忘问题。研究提出了Memory-Constrained Online Continual Learning (MC-OCL)和补充在线知识蒸馏（COKD）框架，并通过实验验证了其有效性，改善了模型的稳定性和准确性。

持续学习与机器遗忘的统一框架

BriefGPT - AI 论文速递 ·

本文综述了持续学习的基本设置、理论基础和实际应用，探讨了内存受限设置和神经网络的遗忘问题，提出了应对这些挑战的方法，并讨论了未来研究方向及其在智能城市中的应用。

本地 vs 全球连续学习

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在微调过程中的遗忘问题及其影响。研究提出了可解释的预测模型和新的微调策略，以减少遗忘现象。实验表明，通过回放被遗忘的示例和引入取消学习框架，这些方法在多个NLP任务中显著提高了性能，确保了模型的安全性和隐私保护。

深入剖析语言模型微调中的遗忘现象：基于示例关联的统计分析

BriefGPT - AI 论文速递 ·

本文探讨了联邦学习中的遗忘问题，提出了基于区块链的可信框架和轻量级辅助遗忘模块FedAU，以有效删除数据贡献，保护数据隐私，同时保持模型性能。研究表明，这些方法在准确性和效率上表现优越，适用于实际应用场景。

基于模型解释的联邦机器遗忘的选择性参数更新

BriefGPT - AI 论文速递 ·

本文提出了一种基于提示的连续学习新方法，旨在解决模型在不断变化的数据中出现的遗忘问题。通过引入分层提示（H-Prompts）和动态提示（L2P），该方法在多个基准测试中显著提高了准确率，且无需额外可学习参数，计算成本降低约50%。

专家混合遇上基于提示的连续学习

BriefGPT - AI 论文速递 ·

本文介绍了一种适应性记忆回放框架，旨在解决持续学习中的遗忘问题。通过动态选择训练数据，遗忘率减少了10%。研究提出了新的对抗鲁棒记忆方法，提高了对抗数据的准确性。引入的“忘却以减轻过拟合”范式和基于类原型的条件扩散模型有效缓解了过拟合和灾难性遗忘。此外，DMAD框架在异常检测中表现优异，展示了在复杂场景中的应用潜力。

对抗性多样化记忆回放（ADRM）：在连续学习中缓解记忆过度拟合问题

BriefGPT - AI 论文速递 ·

本文综述了基于预训练模型的持续学习进展，分类现有方法并比较其优缺点。研究提出新方法以解决遗忘问题并提升性能，同时探讨CL模型在真实场景中的有效性及挑战，提出新基准以评估CL策略。

使用预训练模型的现实继续学习方法

BriefGPT - AI 论文速递 ·

本文提出C&F框架，解决连续学习中的遗忘问题，通过创建平坦训练空间保留先前知识。研究引入新正则化器以提升模型泛化性能，探讨权重损失面与稳定性之间的关系，并提出FS-DGPM方法。同时分析深度学习中损失曲率与泛化的关系，强调平坦性与泛化的微妙联系，指出超参数化神经网络泛化的复杂性。

通过 C-Flat 增强持续学习

BriefGPT - AI 论文速递 ·

研究发现带有LoRA的细调预训练语言模型存在遗忘问题，遗忘量与参数数量和更新步数呈移位幂律增长。无法通过停止或调整参数数量来避免遗忘。这为减轻遗忘问题的细调方案提供了重要方向。

微调强化学习模型其实是一种遗忘缓解问题

BriefGPT - AI 论文速递 ·

通过比较决策Transformer（DT）和基于演员-评论者结构与经验回放的现有方法，研究发现DT在学习效率、分布转移缓解和零-shot泛化方面具有优势，但在监督参数更新时会加剧遗忘问题。引入多头DT（MH-DT）和低秩自适应DT（LoRA-DT）以减轻遗忘问题。实验结果表明，该方法在增强学习能力和内存效率方面优于现有的CORL基准。

使用决策 Transformer 解决持续离线强化学习

BriefGPT - AI 论文速递 ·