本文探讨了强健模型与非强健模型的区别,分析了16个零-shot CLIP视觉编码器的表示空间。研究发现,强健模型中存在异常特征,表明其对ImageNet分布变化的鲁棒性。零-shot CLIP模型编码了更多独特概念,但与鲁棒性无关,可能与语言监督有关。这些异常特征有助于评估预训练模型的鲁棒性。
本研究提出了一个强健的盲图像质量评估方法,通过训练多个基于 Swin-Transformer 的模型并生成伪标签构建了大规模真实世界图像数据集,训练了跨数据集强健模型,交叉数据集测试结果表明该方法性能优于最新方法。
完成下面两步后,将自动完成登录并继续当前操作。