极限公园 our 与机器人
原文中文,约2100字,阅读约需5分钟。发表于: 。该研究报告表明,使用一个低成本机器人具备不精确的驱动和单一前置深度摄像头来感知低频、抖动、容易产生伪影的情况下,采用一个单一的神经网络算法模型通过在模拟环境进行大规模强化学习训练,可以实现端到端的高精准控制行为,从而使机器人能够以超过自身尺寸两倍的高度跳跃障碍物、跨越两倍长度的缝隙、做手倒立和奔跑在倾斜的坡道上,并具有在具有不同物理特性的新颖障碍课程中的泛化能力。
研究表明,使用低成本机器人和单一前置深度摄像头,通过大规模强化学习训练单一神经网络算法模型,可以实现机器人高精准控制行为,跳跃障碍物、跨越缝隙、做手倒立和奔跑在倾斜的坡道上,并具有泛化能力。