💡
原文日文,约1500字,阅读约需4分钟。
📝
内容提要
哥本哈根信息技术大学的研究团队提出了一种自组织神经网络(LNDP),能够以活动和奖励依赖的方式实现突触和结构的可塑性。他们通过扩展神经发育程序(NDP)模型来解决时间上的限制,并使用局部计算和全局奖励函数来实现可塑性。研究团队在强化学习任务中测试了LNDP,并发现它能够自组织地形成功能性网络,并在非平稳环境中具有更好的适应性。他们还展示了预环境自发性活动驱动的发展阶段在网络自组织形成功能单元方面的有效性。
🎯
关键要点
-
生物神经网络具有高度可塑性,影响突触强度和拓扑结构。
-
人工神经网络通常设计为静态结构,面对变化环境时脆弱。
-
哥本哈根信息技术大学提出自组织神经网络LNDP,实现突触和结构的可塑性。
-
LNDP通过扩展神经发育程序(NDP)模型解决时间限制,支持智能体生命周期内的可塑性和结构变化。
-
LNDP依赖于局部计算和全局奖励函数,桥接间接发育编码和元学习的可塑性规则。
-
LNDP由参数化组件组成,定义神经和突触动态,实现结构可塑性。
-
研究团队引入预经验发展机制,基于生物自发性活动建模,提升组件复用性。
-
LNDP在强化学习任务中表现出自组织形成功能性网络的能力。
-
结构可塑性在非平稳动态环境中改善适应性,展示预环境自发性活动的有效性。
-
实验结果显示,具有结构可塑性的模型在非平稳任务中表现更优,且在CartPole环境中展现出固有技能。
➡️