机器之心 ·

闭环端到端精度暴涨19.61%！华科&小米汽车联手打造自动驾驶框架ORION，代码将开源

💡 原文中文，约3000字，阅读约需7分钟。

📝

内容提要

ORION是一个新型的端到端自动驾驶框架，通过视觉语言指令生成轨迹。它结合QT-Former聚合历史信息和VLM进行场景理解，实现推理与动作空间的对齐。在Bench2Drive数据集上，ORION的驾驶得分为77.74，成功率为54.62%，显著优于现有方法。

🎯

🔎

ORION框架通过QT-Former和VLM的结合，显著提升了自动驾驶系统的决策能力。QT-Former有效聚合历史信息，增强了对复杂场景的理解，而VLM则提供了强大的推理能力。这种创新组合使得ORION在动态环境中能够做出更准确的驾驶决策，尤其在超车和紧急刹车等关键场景中表现优异。

ORION的代码和模型即将开源，这将为研究者和开发者提供一个强大的工具，推动自动驾驶技术的进一步发展。开源不仅促进了技术的透明性，还可能激发更多的创新和应用，尤其是在复杂环境下的自动驾驶解决方案。

尽管ORION在Bench2Drive数据集上表现出色，但在实际应用中仍面临挑战。复杂的交通环境和不可预见的情况可能影响其决策能力。此外，VLM在处理数值推理方面的不足，可能限制了ORION在某些场景下的表现。因此，持续优化和测试是确保其可靠性的关键。

❓

ORION框架通过视觉语言指令生成轨迹，结合QT-Former和VLM实现场景理解和推理，优化自动驾驶决策。

ORION在Bench2Drive数据集上取得了77.74的驾驶得分和54.62%的成功率，显著优于现有方法。

QT-Former用于聚合长期历史上下文信息，增强模型对历史场景的理解能力，减少计算开销。

VLM通过强大的推理能力分析驾驶场景，并生成规划token，指导轨迹预测，从而提升自动驾驶能力。

ORION通过生成模型对齐推理空间与动作空间，并引入QT-Former聚合长时序信息，提供了一种新的端到端自动驾驶解决方案。

ORION在超车、紧急刹车和交通标志识别等复杂场景中表现优异，展现了强大的驾驶能力。

🏷️