X-HRNet: 基于空间一维自注意力的轻量级人体姿态估计
原文中文,约300字,阅读约需1分钟。发表于: 。通过引入 Spatially Unidimensional Self-Attention (SUSA),我们减少了 pointwise(1x1)卷积的计算复杂度,并构建了轻量级姿势估计框架 X-HRNet,该框架在 COCO 基准测试中表现卓越,并且 SUSA 模块的有效性得到了全面验证。
HigherHRNet是一种新的下向人体姿态估计方法,使用高分辨率特征金字塔学习尺度感知表示,具有多分辨率监督训练和多分辨率聚合推理的能力。它能够解决下向多人姿势估计中的尺度变化挑战,从而更精确地定位关键点,特别适用于小尺寸人体。在COCO test-dev中,它比以前最好的下向方法提高了2.5% AP,在CrowdPose test上甚至超过了所有自上而下的方法,表明其在拥挤场景中具有鲁棒性。