小红花·文摘

本研究探讨多模态基础模型在自主驾驶中的响应能力，特别是在分布外情境下的表现。通过Robusto-1数据集，发现人类与视觉语言模型在认知层面上的一致性与差异性与提问类型密切相关。