小红花·文摘

该研究介绍了一种名为层次反馈传播 (LFP) 的新型训练方法，利用层次相关传播 (LRP) 为神经网络预测器中的个别连接分配奖励。LFP 在模型中传播奖励信号，增强了接收到积极反馈的结构，减少了接收到负反馈的结构的影响。研究还探讨了将不同的LRP规则扩展到LFP中的方法，以及潜在的应用，例如训练没有有意义的导数的模型或用于转移学习。