本研究提出VLM-E2E框架,解决自主驾驶系统在复杂环境中语义信息不足的问题。通过整合视觉语言模型,增强语义监督,模拟人类驾驶行为,在nuScenes数据集上显著提升性能。
完成下面两步后,将自动完成登录并继续当前操作。