本研究提出了一种新型稀疏视觉变压器模型SparseFormer,旨在提高高分辨率宽图像中的物体检测准确性和效率。该模型通过选择性注意力标记,结合全局与局部关注,处理尺度变化,并利用非极大抑制算法精确定位物体。实验结果表明,SparseFormer在准确性和速度上显著优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。