从少量学习:强化学习中的SINDy代理模型
📝
内容提要
本文针对强化学习中环境建模的不足,提出了一种利用稀疏非线性动力学识别算法(SINDy)开发代理环境的新方法。通过在OpenAI Gym下的多项实验证明,该方法在捕捉环境动态的同时,计算成本降低了20-35%,为模型基础的强化学习提供了高效且可解释的环境生成方案。
🏷️
标签
➡️