NeCo:通过补丁邻居一致性在19个GPU小时内提升DINOv2的空间表示
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
DenseDINO是一种自监督学习框架,用于学习密集视觉表示。它通过引入基于token的点级监督,利用了空间信息。在ImageNet分类评估中表现有竞争力,在PascalVOC语义分割中实现了大幅度提升。
🎯
关键要点
- DenseDINO是一种自监督学习的transformer框架,用于学习密集视觉表示。
- 通过跨视图引入基于token的点级监督,利用了密集预测任务中的空间信息。
- DenseDINO在ImageNet分类评估中表现有竞争力。
- 在PascalVOC语义分割中,DenseDINO在线性探测协议下实现了+7.2%mIoU的提升。
➡️