该文介绍了一种名为视觉保留网络(ViR)的新的计算机视觉模型,具有双并行和循环结构,可在快速推理和并行训练之间达到最佳平衡,并具有可扩展性。ViR 是第一个尝试在通用视觉骨干网络中实现双并行和循环等效性的方法,通过大量实验证实了 ViR 的有效性,并提供了代码和预训练模型的公开获取。
完成下面两步后,将自动完成登录并继续当前操作。