小红花·文摘

本研究利用深度强化学习控制器，实现了人形机器人在多种环境下的行走、转弯和爬楼梯等功能，具有强适应性和无需预训练的优点。通过模型预测损失函数，提升了四足机器人步行的样本效率，并结合在线规划和离线学习，提出了混合控制架构，增强了稳健性和脚步精确度。