本研究提出了一种新方法,通过单视角图像重建手物体交互。利用基础模型的泛化能力,设计了新的管道来估计手势和物体形状,并通过优化方案提高重建精度。实验结果表明,该方法在多种数据集上表现优异。
本文介绍了HAnd Mesh Recovery (HAMR)框架,能够从单个RGB图像重建人手的3D网格,并探讨了透明物体的深度信息获取及手物体交互的几何关系预测。研究提出多种深度学习方法,显著提高了重建精度和操作控制能力。
本文介绍了一种新颖的隐式局部表面表示模型,成功将机器人掌握经验迁移到新对象上,提升了空间精度和掌握准确性。研究还提出了基于关节的传感器和时空转换网络,增强了手物体交互的泛化能力,并在多个数据集上验证了其优越性。
本文介绍了一种通过对短视频剪辑进行手物体交互的重建任务的方法,通过优化每个视频的3D推断,恢复物体形状的神经3D表示和时间变化的动作和手关节。使用通用的数据驱动先验来引导重建过程中的多视角信号,实现准确的3D结果。实证评估表明,该方法相较于先前的方法有显著改进,能够从YouTube中重建任意剪辑,展示了第一人称和第三人称的交互。
完成下面两步后,将自动完成登录并继续当前操作。