该研究介绍了一种名为层次反馈传播 (LFP) 的新型训练方法,利用层次相关传播 (LRP) 为神经网络预测器中的个别连接分配奖励。LFP 在模型中传播奖励信号,增强了接收到积极反馈的结构,减少了接收到负反馈的结构的影响。研究还探讨了将不同的LRP规则扩展到LFP中的方法,以及潜在的应用,例如训练没有有意义的导数的模型或用于转移学习。
完成下面两步后,将自动完成登录并继续当前操作。