野外自觉图像中的 3D 手势姿势估计
原文中文,约400字,阅读约需1分钟。发表于: 。WildHands 是一种用于在野外的视角图像中进行 3D 手势估计的方法,通过使用野外数据的辅助监督以及在实验室数据集中提供的 3D 监督,以及关于相机视野中手势位置的空间线索,能够在 ARCTIC 排行榜上实现最佳 3D 手势姿态并在 EPIC-HandKps 数据集上超越 FrankMocap 方法达到 45.3%的 2D 手势姿态优势。
本研究报告介绍了在Egocentric 3D Hand Pose Estimation挑战赛中的工作,使用AssemblyHands和基于ViT的骨干网络进行3D关键点预测,通过后处理阶段解决了手-物体遮挡和自遮挡引起的性能下降问题,利用测试时间增强和模型集成进一步改进了方法,最终在挑战赛中获得第一名。