机器之心 ·

GTC大会上，理想发布下一代自动驾驶架构MindVLA

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

MindVLA是一种新型视觉-语言-行为大模型，结合空间、语言和行为智能，赋予自动驾驶强大的3D理解和逻辑推理能力。理想汽车在GTC 2025大会上介绍了这一技术，强调其能将汽车转变为智能体，理解用户指令，自主寻找目的地和停车位，提升用户体验，标志着自动驾驶技术的重大进步。

🎯

🔎

MindVLA结合了空间、语言和行为智能，赋予自动驾驶系统强大的3D理解和逻辑推理能力。这种技术的整合不仅提升了车辆的自主决策能力，还使其能够在复杂环境中更好地适应和应对各种情况，标志着自动驾驶技术的重大进步。

有了MindVLA赋能的汽车，用户可以通过语音指令与车辆进行互动，改变行驶路线或寻找停车位。这种智能化的交互方式将极大提升用户的驾驶体验，使汽车不仅是交通工具，更是智能助手。

MindVLA的推出可能会重新定义自动驾驶行业，类似于iPhone对手机的影响。随着技术的成熟，未来可能会推动多个行业的协同发展，尤其是在智能交通和物理人工智能领域。

❓

MindVLA是一种新型视觉-语言-行为大模型，结合空间、语言和行为智能，赋予自动驾驶强大的3D理解和逻辑推理能力。

MindVLA使汽车能够理解用户指令，自主寻找目的地和停车位，从而提升用户体验。

MindVLA的六大关键技术包括3D高斯表征、自监督训练、稀疏注意力等。

MindVLA通过全新设计的3D空间编码器和Diffusion优化驾驶轨迹，实现实时驾驶决策。

MindVLA通过Diffusion优化驾驶轨迹，提升在复杂交通环境中的博弈能力。

MindVLA将重新定义自动驾驶，使汽车成为能够与用户沟通的智能体，推动多个行业协同发展。

🏷️