Waymo希望利用谷歌的Gemini来训练其无人驾驶出租车

Waymo希望利用谷歌的Gemini来训练其无人驾驶出租车

💡 原文英文,约700词,阅读约需3分钟。
📝

内容提要

Waymo利用谷歌的多模态大语言模型Gemini开发了新的自动驾驶训练模型EMMA,旨在提升无人驾驶汽车的决策能力。EMMA能够处理传感器数据并生成未来轨迹,以帮助车辆应对复杂环境。尽管在轨迹预测和物体检测方面表现优异,但仍需进一步研究以解决其局限性和潜在风险。

🎯

关键要点

  • Waymo利用谷歌的多模态大语言模型Gemini开发了新的自动驾驶训练模型EMMA。

  • EMMA能够处理传感器数据并生成未来轨迹,帮助无人驾驶汽车做出决策。

  • Waymo首次表明将多模态大语言模型应用于自动驾驶领域。

  • 传统的自动驾驶系统依赖于特定模块,存在扩展性和适应性问题。

  • 多模态大语言模型如Gemini提供了丰富的世界知识和优越的推理能力。

  • EMMA在复杂环境中帮助无人驾驶汽车找到正确路线。

  • Waymo的EMMA模型在轨迹预测、物体检测和道路图理解方面表现优异。

  • EMMA存在局限性,如无法处理3D传感器输入,且处理图像帧数量有限。

  • 使用多模态大语言模型训练无人驾驶汽车存在潜在风险,需要进一步研究。

  • Waymo希望其研究结果能激励更多研究,以解决现有问题并推动自动驾驶技术进步。

➡️

继续阅读