The Verge ·

Waymo希望利用谷歌的Gemini来训练其无人驾驶出租车

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

Waymo利用谷歌的多模态大语言模型Gemini开发了新的自动驾驶训练模型EMMA，旨在提升无人驾驶汽车的决策能力。EMMA能够处理传感器数据并生成未来轨迹，以帮助车辆应对复杂环境。尽管在轨迹预测和物体检测方面表现优异，但仍需进一步研究以解决其局限性和潜在风险。

🎯

🔎

Waymo的EMMA模型利用谷歌的Gemini多模态大语言模型，展示了在复杂环境中提升无人驾驶决策能力的潜力。然而，传统的模块化系统在扩展性和适应性上存在局限，EMMA的成功能否转化为实际应用仍需进一步研究。

Waymo在无人驾驶领域的领先地位面临来自特斯拉等公司的竞争。特斯拉也在开发端到端模型，表明行业内对这一技术的关注。Waymo的EMMA模型在轨迹预测和物体检测方面表现优异，但如何在实际道路条件下验证其有效性仍是关键。

尽管EMMA在多个方面表现出色，但其无法处理3D传感器输入和图像帧数量有限的局限性不容忽视。此外，使用多模态大语言模型的潜在风险，如模型的错误判断，可能对无人驾驶安全构成威胁。未来的研究需聚焦于解决这些问题。

❓

EMMA模型能够处理传感器数据并生成未来轨迹，帮助无人驾驶汽车做出决策。

Waymo选择Gemini是因为它提供丰富的世界知识和优越的推理能力，能够解决传统自动驾驶系统的局限性。

EMMA在轨迹预测、物体检测和道路图理解方面表现优异，帮助无人驾驶汽车在复杂环境中找到正确路线。

EMMA无法处理3D传感器输入，且处理图像帧数量有限，这些都是其局限性。

Waymo希望其研究结果能激励更多研究，以解决现有问题并推动自动驾驶技术进步。

EMMA模型通过生成未来轨迹，帮助无人驾驶汽车在复杂环境中做出决策，例如遇到动物或施工。

🏷️