X-HRNet: 基于空间一维自注意力的轻量级人体姿态估计

通过引入 Spatially Unidimensional Self-Attention (SUSA)，我们减少了 pointwise（1x1）卷积的计算复杂度，并构建了轻量级姿势估计框架 X-HRNet，该框架在 COCO 基准测试中表现卓越，并且 SUSA 模块的有效性得到了全面验证。

HigherHRNet是一种新的下向人体姿态估计方法，使用高分辨率特征金字塔学习尺度感知表示，具有多分辨率监督训练和多分辨率聚合推理的能力。它能够解决下向多人姿势估计中的尺度变化挑战，从而更精确地定位关键点，特别适用于小尺寸人体。在COCO test-dev中，它比以前最好的下向方法提高了2.5% AP，在CrowdPose test上甚至超过了所有自上而下的方法，表明其在拥挤场景中具有鲁棒性。

HigherHRNet 人体姿态估计关键点小尺寸人体尺度感知