小红花·文摘

本研究提出了层级MamBa适应（H-MBA）框架，旨在提升多模态大语言模型在自主驾驶视频解析中的泛化能力。H-MBA通过上下文MamBa和查询MamBa模块，显著提高了视频理解能力，尤其在风险物体检测任务中，相较于之前的方法提高了5.5%的mIoU。