哥本哈根信息技术大学的研究团队提出了一种自组织神经网络LNDP,旨在实现人工神经网络的可塑性和结构变化。该机制依赖于神经元的局部活动和环境的全局奖励函数,能够在智能体生命周期内适应不断变化的环境。实验表明,LNDP在非平稳动态任务中表现出更好的适应性,展示了其在强化学习中的有效性。
完成下面两步后,将自动完成登录并继续当前操作。