本文提出了一种新颖的端到端框架,通过扩散模型和正向运动学层,从单眼图像中估计三维手部姿势。该方法在多个数据集上展示了优越的准确性和鲁棒性,有效解决了抖动问题,并显著提升了姿态估计的效果。
完成下面两步后,将自动完成登录并继续当前操作。