清华大学与咪咕团队联合推出首个沉浸式体积视频数据集ImViD,突破传统视频限制,实现360°真实场景与6-DoF交互,支持动态捕捉与高保真音视频融合,推动元宇宙与数字孪生技术的发展。
本研究提出了一种新的3D物理模拟器3DGSim,旨在从RGB视频中学习物理模拟。该方法通过将图像编码为3D高斯粒子表示,利用变换器传播动态,有效捕捉多种物理行为,具备良好的可扩展性和泛化能力。
本研究引入SketchAgent,解决了人工系统与人类草图动态捕捉之间的差距。该方法无需培训,用户可通过对话生成和修改草图,SketchAgent能够有效合作,生成多样化的草图。
完成下面两步后,将自动完成登录并继续当前操作。