本文介绍了一种基于原型的Transformer架构(PEM),用于图像分割。PEM利用视觉特征的冗余性来提高计算效率,并引入了多尺度特征金字塔网络,能够高效地提取高语义内容的特征。在测试中,PEM表现出色,优于特定任务的架构,并且与计算代价较高的基准模型相媲美甚至更优。
研究人员提出了一种高效的基于原型的Transformer架构(PEM)用于图像分割,利用视觉特征的冗余性来限制计算并提高效率,并引入了高效的多尺度特征金字塔网络。在测试中,PEM表现出色,优于特定任务的架构,并且与计算代价较高的基准模型相媲美甚至更优。
完成下面两步后,将自动完成登录并继续当前操作。