RTMW:实时多人 2D 和 3D 全身姿势估计
原文中文,约300字,阅读约需1分钟。发表于: 。本文介绍了 RTMW(实时多人全身姿势估计模型)系列,用于 2D / 3D 全身姿势估计的高性能模型,结合 FPN 和 HEM 来更好地捕捉不同身体部位的姿势信息,通过两阶段精炼策略增强模型,达到了较高的推断效率和部署友好性,成果在多个全身姿势估计评测中表现出色。
POTR-3D是一种用于多人单目视频的3D姿势估计模型。它使用一种新颖的几何感知数据增强策略,生成具有不同视角的多样化和无限的数据。该方法对未知视角具有鲁棒性,即使在严重遮挡下也能可靠地恢复姿势。它在基准数据集上实现了最先进的性能,并在具有挑战性的户外视频中展示了定性结果。