自主驾驶的广义预测模型
原文中文,约400字,阅读约需1分钟。发表于: 。本文介绍了自动驾驶学科中第一个大规模视频预测模型。通过从网络获取大量数据并与多样且高质量的文本描述配对,我们消除了高成本数据收集的限制并增强了模型的泛化能力。该数据集积累了超过 2000 小时的行驶视频,涵盖了全球各地不同的气候条件和交通场景。我们的模型名为 GenAD,并继承了最近潜变扩散模型的优点,利用新颖的时间推理块处理行驶场景中具有挑战性的动态。我们展示了它可以以零 - shot...
本文介绍了自动驾驶学科中的大规模视频预测模型GenAD,通过获取大量数据并与文本描述配对,消除了数据收集限制并增强了模型泛化能力。GenAD可以泛化到未见过的行驶数据集,超过了其他视频预测模型,具有巨大潜力。