本研究提出了DISaM双策略解决方案,解决了机器人操作任务中主动探索信息的缺失问题。该方法通过因子化的上下文马尔可夫决策过程,有效分离信息寻求与接收策略,显著提升了多种操作任务的表现。
完成下面两步后,将自动完成登录并继续当前操作。