小红花·文摘

本文探讨了利用强化学习算法设计微型游泳机器人，研究其在复杂液体环境中的自主适应行为和最优策略。机器人通过模仿生物运动和深度学习，在有限信息下发现有效运动策略，并学习复杂行为。研究还分析了温度对策略有效性的影响及自我对抗训练的应用。