💡
原文英文,约700词,阅读约需3分钟。
📝
内容提要
Waymo利用谷歌的多模态大语言模型Gemini开发了新的自动驾驶训练模型EMMA,旨在提升无人驾驶汽车的决策能力。EMMA能够处理传感器数据并生成未来轨迹,以帮助车辆应对复杂环境。尽管在轨迹预测和物体检测方面表现优异,但仍需进一步研究以解决其局限性和潜在风险。
🎯
关键要点
-
Waymo利用谷歌的多模态大语言模型Gemini开发了新的自动驾驶训练模型EMMA。
-
EMMA能够处理传感器数据并生成未来轨迹,帮助无人驾驶汽车做出决策。
-
Waymo首次表明将多模态大语言模型应用于自动驾驶领域。
-
传统的自动驾驶系统依赖于特定模块,存在扩展性和适应性问题。
-
多模态大语言模型如Gemini提供了丰富的世界知识和优越的推理能力。
-
EMMA在复杂环境中帮助无人驾驶汽车找到正确路线。
-
Waymo的EMMA模型在轨迹预测、物体检测和道路图理解方面表现优异。
-
EMMA存在局限性,如无法处理3D传感器输入,且处理图像帧数量有限。
-
使用多模态大语言模型训练无人驾驶汽车存在潜在风险,需要进一步研究。
-
Waymo希望其研究结果能激励更多研究,以解决现有问题并推动自动驾驶技术进步。
➡️