小红花·文摘

本研究提出了DISaM双策略解决方案，解决了机器人操作任务中主动探索信息的缺失问题。该方法通过因子化的上下文马尔可夫决策过程，有效分离信息寻求与接收策略，显著提升了多种操作任务的表现。