本论文提出了一种高效的Transformer架构,通过渐进重参数化批归一化和简化线性注意力的方法,在推理阶段提高效率。该方法在多个基准测试中展示了强大的性能,特别适用于图像分类和物体检测任务。
完成下面两步后,将自动完成登录并继续当前操作。