小红花·文摘

本研究提出了一种名为RIG的端到端通用政策，旨在提升嵌入式代理在复杂开放世界中的推理与想象能力。通过协同学习，RIG显著提高了样本效率和泛化能力，增强了政策的鲁棒性和互操作性。