本研究提出了一种基于单目视频的乒乓球击球预测系统,解决了现有系统的有效性问题。通过三维重建和控制器设计,实验表明在高速击球情况下回球率从49.9%提高到59.0%,显示出良好的应用潜力。
本研究提出了一种新框架NutWorld,旨在高效表示单目视频,解决复杂运动、遮挡和几何一致性问题。该方法通过连续的高斯原件流实现高保真视频重建和实时应用,增强了场景建模能力。
本研究提出CAT4D方法,填补了从单目视频生成4D场景的技术空白。该方法结合多视角视频扩散模型和新采样技术,实现了精准的4D重建,并在新视角合成和动态场景重建方面表现出色。
本研究提出了DroidSplat SLAM系统,解决了传统SLAM在鲁棒性、速度和准确性之间的权衡,尤其在单目视频场景中表现优异。该系统在消费级GPU上实现了快速推断,追踪和渲染效果良好。
本研究提出了UniHOI模型,旨在解决自我中心手物体交互视频中的密集点云序列重建问题。该模型通过大规模单目视频数据集进行训练,克服了标记数据稀缺的限制,显著提升了点云重建和三维场景流恢复的效果。
本研究提出了一种新的4D高斯溅射算法,有效解决了动态场景合成中单目视频的过拟合问题,并通过引入不确定性感知正则化显著提升了视频重建性能。
本研究提出了一种新方法,能够高效跟踪单目视频中的密集3D运动,速度提升8倍,准确性达到新高。
该方法利用单目视频和高斯喷洒技术对3D几何和外观进行建模,将3D高斯绑定到身体模板,并通过新技术渲染法线,实现精准的3D网格建模。实验显示,该方法在有限时间内表现优异,比竞争对手快一个数量级,并在姿势变化下提供更好的渲染和3D重建效果。
本文介绍了一种模型,通过少量单目视频帧快速推断个性化3D形状,重建精度可达5mm。模型结合T姿态空间预测和双视图预测,仅依赖合成3D数据学习,能处理不同数量的帧输入,单帧精度为6mm。实验结果验证了其有效性和准确性。
该研究提出了一种通过单目视频创建可动画的3D数字化人类的方法。该方法利用高斯喷洒的效率对3D几何和外观进行建模,并通过表面位移和颜色球谐的隐式建模将3D高斯绑定到身体模板的三角面上。实验结果表明,该方法在有限时间设置下取得了最先进的结果,并在姿势变化下实现了更好的渲染和3D重建性能。
MoDGS是一种利用单目视频生成动态场景新视角图像的管道,采用最新的单视图深度估计方法指导动态场景的学习,并提出了新的三维感知初始化方法和鲁棒深度损失来指导动态场景几何结构的学习。实验证明,MoDGS能够从单目视频中生成高质量的动态场景新视角图像,优于基线方法。
MoDGS是一种利用单目视频生成动态场景新视角图像的管道,采用最新的单视图深度估计方法来指导动态场景的学习,并提出了新的三维感知初始化方法和鲁棒深度损失来指导动态场景几何结构的学习。实验证明,MoDGS能够从单目视频中生成高质量的动态场景新视角图像,优于基线方法。
MultiPhys是一种从单目视频中恢复多人运动的方法,通过使用物理知识来准确捕捉人与人之间的协调空间布局,消除穿透问题和抖动干扰,得到具有动力学一致性和物理合规性的运动估计结果。
本研究提供了首个非标记的方法来实现单目视频中的三维运动捕捉和关节骨架重建。通过卷积神经网络和低维轨迹子空间解决挑战,实现了最先进的性能捕捉结果。
该研究提出了一种基于神经隐式表示和不可导函数的算法,能够从单目视频中生成任意视角和任意时间步长下的新视图。通过联合训练静态和动态NeRF,并使用正则化约束解决样本不足问题,取得了良好的实验效果。
本研究提供了首个非标记的方法来实现单目视频中的三维运动捕捉和关节骨架重建。通过使用卷积神经网络和低维轨迹子空间解决挑战,实现了最先进的性能捕捉结果。
本研究提供了首个非标记的单目视频三维运动捕捉方法,解决了关节运动、快速运动和非刚性变形等挑战。通过卷积神经网络和低维轨迹子空间解决单目重构问题,并提出了基于表面几何的细化方法。该方法在准确性、鲁棒性和处理复杂场景方面优于先前的单目方法。
该研究提出了一种基于神经隐式表示及不可导函数的算法,能够从单目视频中生成任意视角和任意时间步长下的新视图。通过联合训练静态和动态的NeRF,并使用正则化约束解决了样本不足的问题,实验效果良好。
完成下面两步后,将自动完成登录并继续当前操作。