本研究提出了一种名为RIG的端到端通用政策,旨在提升嵌入式代理在复杂开放世界中的推理与想象能力。通过协同学习,RIG显著提高了样本效率和泛化能力,增强了政策的鲁棒性和互操作性。
完成下面两步后,将自动完成登录并继续当前操作。