小红花·文摘

本研究提出了一种两阶段通用策略框架，结合扩散规划者和逆动力学模型，以解决智能体在多种决策任务中的适应性问题。实验结果显示，联合训练不同智能体的数据集可提高任务完成精度，最高提升42.20%。