研究人员提出了一种名为“随机共振变压器”(SRT)的零样本方法,通过子标记空间平移扰动输入图像,改善了Vision Transformers(ViTs)中的量化伪像问题。SRT可以有效地超分辨率预训练ViTs的特征,捕捉到更多的局部细粒度结构,并在多个任务上展现改进效果,无需微调。
完成下面两步后,将自动完成登录并继续当前操作。