小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新的最大更新参数化（$bc$P），用于优化局部学习算法在神经计算中的复杂性。通过分析深层线性网络，发现$bc$P在无限宽度极限中具有独特性质，能够在不同宽度模型间转移超参数，并在特定设置下表现接近一阶梯度，对局部损失优化具有重要影响。

Local Loss Optimization in Infinite Width: Stable Parameterization of Predictive Coding Networks and Target Propagation

BriefGPT - AI 论文速递 ·

本研究提出了一种通过最大更新参数化（muP）解决大规模语言模型超参数调整的新方法。研究表明，muP在不同模型间实现了有效的超参数迁移，特别是在Transformer和ResNet上表现优异。通过优化学习率和超参数，显著提升了模型的泛化能力。

u-$μ$P: Unit Scaling of Maximal Update Parametrization

BriefGPT - AI 论文速递 ·