小红花·文摘

本研究提出了一种名为MR.Q的统一无模型深度强化学习算法，旨在解决现有算法对特定基准和超参数调整的依赖。该方法通过模型基础表示近似线性化价值函数，在多样任务中展现出竞争力性能，为通用无模型深度强化学习奠定基础。