小红花·文摘

该研究提出了一种新的架构和训练程序，通过训练简单的任务，使脊髓网络与本体感觉运动神经元进行学习。通过修正脊髓网络的输入来驱动行为，从稀疏的奖励中有效地进行探索。在三种虚拟体内进行测试并取得了明显的进展。