本文从统计学角度展示了样本高效强化学习的条件比传统观点更苛刻,研究结果揭示了好的表示本身不足以实现高效强化学习,除非通过硬性门槛保证近似质量。研究还指出了不同学习方法之间的样本复杂度呈指数倍增长。
完成下面两步后,将自动完成登录并继续当前操作。