本研究探讨了多模态持续指令调优中的遗忘问题,提出了表层遗忘与基础遗忘的分类。通过答案样式多样化(ASD)和RegLoRA正则化技术,有效避免表层遗忘,提升模型在新任务学习中的表现。
本文探讨了联邦持续学习中的遗忘问题,提出在数据或任务不相关时,准确遗忘某些信息可以提升学习效果。通过引入“准确遗忘”概念,并基于生成重放的方法,定量评估先前知识的可信度,实验结果表明该方法优于基准模型。
本研究探讨了垂直联邦学习中的遗忘问题,提出了VFU-KD和VFU-GA方法,通过知识蒸馏和梯度上升实现遗忘,实验结果表明其优于重新训练,具有实用价值。
该研究针对多模态推荐模型中的表示不匹配和遗忘问题,提出了一种定制化训练方法,显著提升了推荐系统的性能和用户体验。
本研究提出了一种新颖的对齐特征隔离方法,旨在解决增量人脸伪造检测中的遗忘问题。通过堆叠旧任务和新任务的特征分布,保护已学习的伪造信息,实验结果验证了该方法的有效性。
该研究提出了一种类独立转换(CIT)方法,旨在解决类增量语义分割中学习新类别时避免遗忘旧类别的问题。通过建立累积蒸馏框架,确保所有类别信息的公平融合,实验结果表明在不同数据集上任务遗忘率极低。
本研究提出了一种名为packetLSTM的动态LSTM方法,旨在针对流数据中的变化输入特征空间进行在线学习。该方法为每个输入特征设置专门的LSTM,并利用共享的全局内存,持续学习以缓解遗忘问题。packetLSTM在五个数据集上表现优异,且可扩展至其他RNN类型。
本研究提出一种新方法,通过调整训练权重和改变梯度方向,减少类增量学习中敏感群体的遗忘问题,提升群体公平性。实验表明,该方法在真实数据集上比现有方法更好地平衡准确性和公平性。
本文介绍了一种新型神经网络连续学习算法UCL,解决了正则化方法的主要问题,表现优异。研究了多种持续学习方法及其在视频和图像识别中的应用,提出了有效的遗忘问题解决方案,并展示了新方法在减少遗忘和提高准确率方面的优势。
本文研究了持续学习中的任务增量分类方法,提出了一种新的框架以平衡稳定性与可塑性。通过多个基准测试,比较了11种持续学习方法,并提出了解决遗忘问题的方案,如任务无关表示巩固(TARC)和有监督对比学习框架,展示了其在不同学习场景中的有效性和优越性。
本文探讨了多模型和多级别知识蒸馏策略,以提升持续学习中的性能并解决旧类知识遗忘问题。研究提出了Memory-Constrained Online Continual Learning (MC-OCL)和补充在线知识蒸馏(COKD)框架,并通过实验验证了其有效性,改善了模型的稳定性和准确性。
本文综述了持续学习的基本设置、理论基础和实际应用,探讨了内存受限设置和神经网络的遗忘问题,提出了应对这些挑战的方法,并讨论了未来研究方向及其在智能城市中的应用。
本文探讨了大型语言模型(LLMs)在微调过程中的遗忘问题及其影响。研究提出了可解释的预测模型和新的微调策略,以减少遗忘现象。实验表明,通过回放被遗忘的示例和引入取消学习框架,这些方法在多个NLP任务中显著提高了性能,确保了模型的安全性和隐私保护。
本文探讨了联邦学习中的遗忘问题,提出了基于区块链的可信框架和轻量级辅助遗忘模块FedAU,以有效删除数据贡献,保护数据隐私,同时保持模型性能。研究表明,这些方法在准确性和效率上表现优越,适用于实际应用场景。
本文提出了一种基于提示的连续学习新方法,旨在解决模型在不断变化的数据中出现的遗忘问题。通过引入分层提示(H-Prompts)和动态提示(L2P),该方法在多个基准测试中显著提高了准确率,且无需额外可学习参数,计算成本降低约50%。
本文介绍了一种适应性记忆回放框架,旨在解决持续学习中的遗忘问题。通过动态选择训练数据,遗忘率减少了10%。研究提出了新的对抗鲁棒记忆方法,提高了对抗数据的准确性。引入的“忘却以减轻过拟合”范式和基于类原型的条件扩散模型有效缓解了过拟合和灾难性遗忘。此外,DMAD框架在异常检测中表现优异,展示了在复杂场景中的应用潜力。
本文综述了基于预训练模型的持续学习进展,分类现有方法并比较其优缺点。研究提出新方法以解决遗忘问题并提升性能,同时探讨CL模型在真实场景中的有效性及挑战,提出新基准以评估CL策略。
本文提出C&F框架,解决连续学习中的遗忘问题,通过创建平坦训练空间保留先前知识。研究引入新正则化器以提升模型泛化性能,探讨权重损失面与稳定性之间的关系,并提出FS-DGPM方法。同时分析深度学习中损失曲率与泛化的关系,强调平坦性与泛化的微妙联系,指出超参数化神经网络泛化的复杂性。
研究发现带有LoRA的细调预训练语言模型存在遗忘问题,遗忘量与参数数量和更新步数呈移位幂律增长。无法通过停止或调整参数数量来避免遗忘。这为减轻遗忘问题的细调方案提供了重要方向。
通过比较决策Transformer(DT)和基于演员-评论者结构与经验回放的现有方法,研究发现DT在学习效率、分布转移缓解和零-shot泛化方面具有优势,但在监督参数更新时会加剧遗忘问题。引入多头DT(MH-DT)和低秩自适应DT(LoRA-DT)以减轻遗忘问题。实验结果表明,该方法在增强学习能力和内存效率方面优于现有的CORL基准。
完成下面两步后,将自动完成登录并继续当前操作。