DPaRL:耶鲁+AWS出品,开放世界持续学习场景的新解法 | ECCV'24 - 晓飞的算法工程笔记
💡
原文中文,约3100字,阅读约需8分钟。
📝
内容提要
本文提出了一种新的开放世界持续视觉表征学习方法DPaRL,通过动态生成提示增强模型对未见类别的泛化能力。实验结果表明,DPaRL在开放世界图像检索基准上表现优越,Recall@1提升4.7%,有效应对动态开放世界环境中的持续学习挑战。
🎯
关键要点
- 提出了一种新的开放世界持续视觉表征学习方法DPaRL,增强模型对未见类别的泛化能力。
- DPaRL通过动态生成提示来有效更新区分性表征主干网络。
- 在开放世界图像检索基准上,DPaRL的Recall@1性能平均提高了4.7%。
- 开放世界环境中持续学习面临的挑战是如何有效泛化到未见的测试类。
- DPaRL采用动态提示生成网络,替代静态提示池,增强了模型的能力。
- 动态提示生成过程中引入阶段token,以保留每个学习阶段的信息。
- DPG生成的提示通过映射函数连接到主干模型所需的提示tokens。
- DPaRL联合学习动态提示生成和区分性表示,最大化模型能力,减少灾难性遗忘。
➡️