该文介绍了一种通过手物体交互的重建任务来进行短视频剪辑的3D推断的方法。作者使用通用的数据驱动先验来引导重建过程中的多视角信号,并在6个物体类别的自我中心视频上进行了实证评估。结果显示,该方法相较于先前的单视角和多视角方法有显著的改进。最后,作者展示了他们的系统能够从YouTube中重建任意剪辑,展示了第一人称和第三人称的交互。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: