机器之心 ·

最晚明年上半年落地L3：理想端到端自动驾驶，性能大幅提升

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

理想汽车发布第三代自动驾驶技术架构，采用端到端+视觉语言模型+世界模型的方法，提高AI的信息处理效率和对复杂路况的应对能力。该架构受到诺贝尔奖得主丹尼尔·卡尼曼的快慢系统理论启发，模拟人类的思考和决策过程。理想汽车已全面切入端到端+大模型方案，让车辆能够理解复杂路况和交通规则。他们利用用户数据进行训练和验证，提高系统的能力上限和迭代速度。下半年实现端到端+视觉语言模型的自动驾驶量产交付是他们的下一个目标。

🎯

关键要点

理想汽车发布第三代自动驾驶技术架构，采用端到端+视觉语言模型+世界模型的方法。
该架构提高了AI的信息处理效率和对复杂路况的应对能力。
架构受到诺贝尔奖得主丹尼尔·卡尼曼的快慢系统理论启发，模拟人类的思考和决策过程。
新一代自动驾驶系统降低了技术研发团队规模的需求，提升了用户体验。
快系统处理简单任务，慢系统用于复杂分析，二者协同提升自动驾驶能力。
理想汽车全面切入端到端+大模型方案，车辆能够理解复杂路况和交通规则。
DriveVLM论文展示了视觉语言模型在自动驾驶中的应用，提升了视觉理解和推理能力。
DriveVLM包含场景描述、场景分析和分层规划三个关键模块，提升了自动驾驶系统的能力。
理想汽车利用生成模型补充新的视角，进行场景的延伸泛化和系统检验。
新一代AI模型可以不断给出考题，提升系统能力和迭代速度。
理想汽车面临算力挑战，优化AI决策时延以保证安全。
理想汽车的目标是实现端到端+视觉语言模型的自动驾驶量产交付。

❓

延伸问答

理想汽车的第三代自动驾驶技术架构有哪些主要特点？

理想汽车的第三代自动驾驶技术架构采用端到端、视觉语言模型和世界模型的方法，提高了AI的信息处理效率和对复杂路况的应对能力。

理想汽车如何利用用户数据提升自动驾驶系统的能力？

理想汽车通过筛选达到专车司机标准的用户数据，作为训练模型的真实数据，结合世界模型生成模拟题，从而提升系统的能力和迭代速度。

理想汽车的自动驾驶系统是如何模拟人类思考和决策的？

该系统受到丹尼尔·卡尼曼的快慢系统理论启发，通过快系统处理简单任务，慢系统用于复杂分析，二者协同提升自动驾驶能力。

DriveVLM论文中提到的关键模块有哪些？

DriveVLM包含场景描述、场景分析和分层规划三个关键模块，分别对应于传统自动驾驶系统的感知、预测和规划流程。

理想汽车面临哪些算力挑战？

理想汽车面临的算力挑战包括保持AI模型参数量在最优状态，并优化AI决策时延以保证安全。

理想汽车的自动驾驶量产交付计划是什么？

理想汽车的目标是在今年下半年实现端到端和视觉语言模型的自动驾驶量产交付。

🏷️