我们可以普遍地跳跃吗?关于基准选择和设计的讨论,使用Hopper环境
发表于: 。本研究针对当前强化学习领域中基准测试选择的缺乏讨论和科学依据的问题,提出了将基准测试视为一门独立科学学科的观点。通过对不同Hopper环境的案例研究,发现基准选择极大影响算法性能评估,研究呼吁建立统一的语言和标准来合理化基准选择的过程。
本研究针对当前强化学习领域中基准测试选择的缺乏讨论和科学依据的问题,提出了将基准测试视为一门独立科学学科的观点。通过对不同Hopper环境的案例研究,发现基准选择极大影响算法性能评估,研究呼吁建立统一的语言和标准来合理化基准选择的过程。