小红花·文摘

本文讨论了随机矩阵的谱范数估计，得出结论：服从标准正态分布的$n imes m$随机矩阵的谱范数约为$ ext{sqrt}(n) + ext{sqrt}(m)$。通过近似方法和矩阵性质，提供了一种快速估计谱范数的思路，并指出该结果在大样本情况下非常准确。

科学空间|Scientific Spaces ·

本研究利用随机矩阵分析探讨全连接两层神经网络的特征学习及其与泛化能力的关系，揭示特征谱的渐进性质。结果显示，在最大学习率下，特征学习显著提升了泛化能力。

BriefGPT - AI 论文速递 ·

本研究在随机矩阵领域中提出了一种新距离函数，用于有效比较不同的马尔可夫链模型，特别适用于医疗过程。研究显示，无论使用Bhattacharyya角还是新距离函数，模型间的度量结果一致。

BriefGPT - AI 论文速递 ·

本研究解决了变换器中信号传播和梯度消失/爆炸的问题，分析了softmax注意力机制初始状态下的传播问题。通过随机矩阵方法，提出消除谱间隙的方法解决宽度上的秩崩溃，并通过实验验证其有效性。

BriefGPT - AI 论文速递 ·

本文研究了正定核框架下的监督学习，提出了一种基于随机矩阵的低秩近似方法，能够在次平方时间内有效计算核矩阵。同时探讨了分布式低秩逼近和信息排序机制，提出了LoRA和Flora方法，以优化模型的存储和计算效率，并验证了其在大规模数据集中的有效性。

BriefGPT - AI 论文速递 ·

本文探讨了基于随机矩阵的框架分析单层线性网络的学习动态，研究了过拟合、早停和训练初始化等问题。结果显示不同学习速率下的动力学特性，并揭示深度神经网络在复杂行为建模中的有效性，提出改进架构的激活函数，并强调神经元数量对多层网络行为的独立性。

BriefGPT - AI 论文速递 ·