本文介绍了HiViT,一种高效且性能良好的分层视觉转换器。实验证明,HiViT-B在ImageNet-1K上相对于ViT-B的准确率提高了0.6%,比Swin-B快了1.9倍,并在检测和分割等下游任务中提高了泛化性能。
完成下面两步后,将自动完成登录并继续当前操作。