小红花·文摘

该研究使用Q-learning方法在机器人倒立摆平衡问题中进行了实验，并通过模拟环境中的学习阶段和真实系统数据的曲线拟合验证了该方法的可行性。研究强调了在模拟中准确表示物理世界的重要性，以提高强化学习算法在真实环境中的效果。