小红花·文摘

本文探讨了传统矩形图像补丁注意机制在复杂视觉任务中的局限性，提出了一种基于图像分割的原型对象方法。该方法通过使用原型对象，显著降低了表示复杂性，并在参数更少、训练时间更短的情况下，实现了与最新补丁方法相当或更好的性能。