本研究评估了多模态大型语言模型(MLLMs)在自动驾驶领域的应用,并发现它们在预测复杂、动态的驾驶环境中存在不足。研究结果突出了当前领先的MLLMs在真实动态环境中应用能力上的重要差距,强调了需要改进基础模型以提高其在真实世界动态环境中的适用性。
该研究提出了一种基于转换器的神经重定位方法,通过在导航地图和视觉鸟瞰图特征之间进行粗到精的神经特征注册。该方法在无高清地图定位方面优于OrienterNet方法,适用于具有挑战性的驾驶环境,具有成本效益、可靠性和可扩展性。
完成下面两步后,将自动完成登录并继续当前操作。