梦铸:面向多视角驾驶场景的运动感知自回归视频生成 发表于:2024-09-06T00:00:00Z。 本研究关注于视频生成中的时间一致性和长视频生成问题,提出了名为DreamForge的创新模型。这一模型利用扩散技术,结合灵活的条件支持和运动线索,能够生成精确且连贯的3D驾驶场景视频,具有显著的控制能力和扩展性。