海豚:驾驶的多模态语言模型

📝

内容提要

Dolphins 是一种新颖的视觉 - 语言模型,具有人类般的理解和反应能力,用于作为对话式驾驶助手,能够处理多模态输入以生成相应的指令。通过在驾驶领域构建特定的指令数据,Dolphins 能够全面理解复杂且多样的开放式驾驶场景,并解决各种自动驾驶任务,同时具备人类般的能力,能够通过上下文学习进行快速适应和通过反思进行错误恢复。

🏷️

标签

➡️

继续阅读