本研究提出了一种新的视频生成模型PoseTraj,旨在解决现有模型在处理物体动态变化和复杂姿势时的3D理解不足问题。通过两阶段预训练和PoseTraj-10K数据集,显著提升了模型的姿态感知能力,实验结果表明其在轨迹准确性和视频质量上优于现有基线。
完成下面两步后,将自动完成登录并继续当前操作。