TokenHMR:使用令牌化姿态表示改善人体网格恢复
原文中文,约600字,阅读约需2分钟。发表于: 。从单个图像中推断 3D 人体姿态和形状的问题,重点关注 3D 准确性。目前最好的方法利用大量的 3D 伪地面真值 (p-GT) 和 2D 关键点数据集,以实现稳健性能。我们观察到,随着 2D 准确性的提高,3D 姿势准确性出现矛盾下降。错误的 3D 姿势是由于当前相机模型的偏差和 2D 关键点与 p-GT 的准确匹配引起的。我们定量化了当前相机模型引入的误差,并证明精确拟合 2D 关键点和...
本文研究了从单个图像中推断3D人体姿态和形状的问题。作者提出了新的阈值自适应损失缩放方法来提高3D准确性,并利用人体姿势的Token编码重新定义了问题,引入了一个统一的先验。实验证明,这些方法能够在野外数据上进行训练,并提高了3D准确性。