小红花·文摘

本研究提出了一种新型稀疏视觉变压器模型SparseFormer，旨在提高高分辨率宽图像中的物体检测准确性和效率。该模型通过选择性注意力标记，结合全局与局部关注，处理尺度变化，并利用非极大抑制算法精确定位物体。实验结果表明，SparseFormer在准确性和速度上显著优于现有方法。