本研究提出了一种改进的Hebbian学习网络,通过权重归一化机制解决了人工神经网络在离散外部条件下的脆弱性。实验表明,该网络在复杂机器人上实现了零-shot适应行走,能够有效应对未见条件。
本研究在CrossQ框架中整合权重归一化,解决了强化学习的样本效率瓶颈,显著提升了训练的稳定性和效率。
完成下面两步后,将自动完成登录并继续当前操作。