本研究提出了CH-MARL框架,结合分层决策与动态约束,显著降低全球温室气体排放,提升公平性与效率,适用于海事物流环境。
该研究提出了基于三维重建环境的机器人视觉和语言导航(Robo-VLN)的设定,并通过分层决策、模块化训练和分离推理和模仿的策略成功解决了这一新任务。研究者使用HCM代理展示了比现有基线效果更好的结果,为Robo-VLN创造了新的基准。
完成下面两步后,将自动完成登录并继续当前操作。