研究比较了轻量级视觉变换器(ViTs)和轻量级卷积神经网络(CNNs)在移动设备上的性能,提出了新的轻量级CNNs家族RepViT。实验表明,RepViT在ImageNet上表现优异,在iPhone 12上准确率超过80%,延迟仅1毫秒。最大模型RepViT-M3达到了81.4%的准确率。
完成下面两步后,将自动完成登录并继续当前操作。