基于重建模型的PartRM方法实现了铰链物体的部件级运动建模,生成三维表征以支持机器人操控。研究表明,PartRM在生成效率和结果质量上显著提升,已被CVPR 2025录用。
本研究提出了一种基于扩散的MIKU舞蹈方法,用于角色艺术动画。该方法结合混合运动建模和混合控制扩散技术,解决了高动态运动和参考引导失调的问题,显著提升了动画质量和运动表现。
该论文介绍了多种视频生成技术,包括MotionCtrl、CameraCtrl和无训练的COMD模型,旨在实现精确的相机和物体运动控制。研究表明,通过显式运动建模和引入物理约束,可以显著提升视频生成的可控性和质量,解决了传统方法中的运动准确度问题。
本研究提出了多种先进的多目标跟踪(MOT)方法,如空间-时间关系网络(STRN)和MOTR,显著提升了跟踪精度和效率。研究结合了目标检测、身份链接和时间上下文,在多个基准测试中表现优越,特别是在无人机跟踪任务中有效解决了运动建模和遮挡问题。
本研究探讨了神经场在物体姿态估计和运动建模中的应用,提出了多种方法,包括从单个RGB图像估计物体的六自由度姿态、动态3D场景模型学习及实时跟踪。这些方法在多个数据集上表现优异,展示了神经场在视觉计算和机器人领域的潜力。
该研究介绍了多个视频生成框架,如 Click to Move (C2M) 和 Motion-I2V,利用运动建模和自监督学习实现高质量、可控的视频生成。模型通过创新的运动引导和图像特征结合,在多个数据集上表现优越,能够独立控制对象和相机运动,提升动画生成的精细度和交互性。
完成下面两步后,将自动完成登录并继续当前操作。