小红花·文摘

本研究提出了一种新的视频生成模型PoseTraj，旨在解决现有模型在处理物体动态变化和复杂姿势时的3D理解不足问题。通过两阶段预训练和PoseTraj-10K数据集，显著提升了模型的姿态感知能力，实验结果表明其在轨迹准确性和视频质量上优于现有基线。