AI初创公司Runway推出了Gen-4视频模型,能够在多个镜头中生成一致的场景和人物。该模型允许用户通过单一参考图像生成角色和物体,提供更好的故事连贯性和控制力。用户只需描述构图,模型便能从多个角度生成一致的输出。
本研究提出HAD-Gen框架,以解决传统驾驶模型在模拟人类驾驶行为多样性方面的不足。通过聚类车辆轨迹和最大熵逆强化学习,该框架实现了更人性化的驾驶行为,实验结果显示其场景生成能力优于以往方法,目标达成率高达90.96%。
本研究提出了一种解耦槽注意力模块,旨在解决现有物体中心学习方法在不同场景下识别相同物体的难题。该方法能够提取物体的全局不变属性,提升物体识别和复杂场景生成的能力。实验结果表明,该方法在全局物体中心表示学习和场景分解方面表现优异,具有重要的应用潜力。
BDD100K是最大的驾驶视频数据集,支持自主驾驶算法评估。DriveSceneGen生成高保真动态驾驶场景,DriveDreamer-2利用语言模型生成定制视频。GenAD模型通过大量数据提升预测能力,Delphi生成长视频以提高规划性能,SimGen模型结合模拟与现实数据,增强自动驾驶系统的可扩展性和安全性。
本文提出了一种名为Scenario Diffusion的基于扩散的场景生成架构,用于自动驾驶车辆的安全验证。该方法结合潜在扩散、目标检测和轨迹回归,能够生成多样化的交通场景,并通过地图和令牌组进行控制。实验结果表明,该架构在自动生成安全关键场景方面优于传统方法,提升了自动驾驶算法的测试效率和适应性。
本文提出了一种名为Scenario Diffusion的基于扩散的场景生成架构,可实现可控的场景生成。该方法结合了潜在扩散、目标检测和轨迹回归,能够建模多样的交通模式,并且适用于不同的地理区域。
该文介绍了基于3D-GPT的指令驱动的3D建模框架,能高效进行自动内容创作,简化场景描述并提取参数值,与3D软件无缝集成,为未来场景生成和动画的发展提供基础。
完成下面两步后,将自动完成登录并继续当前操作。