该研究提出了一种新的架构和训练程序,通过训练简单的任务,使脊髓网络与本体感觉运动神经元进行学习。通过修正脊髓网络的输入来驱动行为,从稀疏的奖励中有效地进行探索。在三种虚拟体内进行测试并取得了明显的进展。
完成下面两步后,将自动完成登录并继续当前操作。