小红花·文摘

本文介绍了一种基于数据增强驱动的方法，使用重新参数化的视觉Transformer（ReVT）和多模型训练后的权重平均化，实现了语义分割的域通用化。该方法在多个基准数据集上实现了小型模型和中型模型的最新mIoU性能，分别为47.3％和50.1％，相比之前的技术提高了1％和2.3％。此外，该方法需要更少的参数，帧速率更高，易于实施，并且在推断期间不会增加计算复杂度。