小红花·文摘

AdEMAMix优化器：更好、更快、更久

Apple Machine Learning Research ·

该研究提出了一种通过离散键值瓶颈实现局部更新的方法，以解决持续学习中的模型遗忘问题，有效减轻灾难性遗忘，并在多个NLP场景中表现出竞争力。

Achieving Continual Learning in Encoder Language Models through Discrete Key-Value Bottlenecks

BriefGPT - AI 论文速递 ·

本文探讨了自注意力机制的神经网络模型（如Transformer）在联邦学习中的应用，特别是在处理异构数据时的性能改进。研究提出了多种新方法，如Federated Knowledge Anchor (FedKA)，以解决模型遗忘问题并提高准确性。实验结果表明，这些方法在医学数据集上表现优越，有效应对数据异质性带来的挑战。

联邦印象:使用分布式异构数据进行学ä¹

BriefGPT - AI 论文速递 ·

本文提出了一种新型增量学习方案，通过神经网络原型匹配、特征稀疏化和对比学习，解决了模型在学习新任务时遗忘旧任务的问题。该方案在Pascal VOC2012和ADE20K数据集上表现出显著的准确性，优于现有技术。

基于双曲空间的开放世界感知中的分类学感知连续语义分割

BriefGPT - AI 论文速递 ·