利用视觉变换器改善无源目标适应性,以削弱域表示图像
原文中文,约200字,阅读约需1分钟。发表于: 。该研究以无监督域自适应为主题,探索了如何利用关键元素来强化 Vision Transformers 在无源目标适应中的性能,通过引入域表示图像(DRIs)作为关键组件,提高了 Transformer 在领域泛化中的效率。
本研究提出了一种名为“可传递视觉Transformer”的统一框架,融合了迁移学习、注意力机制和聚类方法,实现了无标签目标域的知识迁移。TVT方法优于微调和迁移学习方法,通过注入传递性适应模块来强制ViT集中注意力在可转移和辨别性特征上,并借助判别性聚类来增强特征多样性和分离度。