本文探讨了传统矩形图像补丁注意机制在复杂视觉任务中的局限性,提出了一种基于图像分割的原型对象方法。该方法通过使用原型对象,显著降低了表示复杂性,并在参数更少、训练时间更短的情况下,实现了与最新补丁方法相当或更好的性能。
完成下面两步后,将自动完成登录并继续当前操作。