小红花·文摘

大型语言模型如何学习

ByteByteGo Newsletter ·

梯度下降：机器学习优化的引擎

MachineLearningMastery.com ·

小猫都能懂的大模型原理 4 - 大语言模型架构

UsubeniFantasy ·

从零开始在Rust中实现MNIST数据集的神经网络

DEV Community ·

本文首次精确描述了多层神经网络的梯度下降迭代分布，解决了样本量与特征维度成比例增长的问题。理论揭示了权重的波动与集中特性，并提供了一致的泛化误差估计，指导早停与超参数调优。

Precise Gradient Descent Training Dynamics of Finite Width Multilayer Neural Networks

BriefGPT - AI 论文速递 ·

本文介绍了机器学习的基础知识，重点讲解了线性回归模型及其实现。机器学习是人工智能的一个分支，通过数据训练模型以发现规律。线性回归用于估计因变量与自变量之间的线性关系，核心在于找到最佳拟合直线。文章还探讨了梯度下降法和正规方程的求解方法，并提供了相关的Python代码示例。

机器学习的线性回归模型

FreeBuf网络安全行业门户 ·

让微梯度完美预测样本问题的答案

DEV Community ·

本文探讨了过参数化深度学习网络在监督学习中实现零损失的条件，并提供了构造零损失最小化器的方法，指出网络深度增加可能降低梯度下降效率。

过参数化深度学习网络的零损失保证与显式最小化器

BriefGPT - AI 论文速递 ·

本研究提出了一种基于梯度下降训练的规则分类器，旨在解决规则模型在可扩展性和优化方面的挑战。实验结果表明，该分类器在准确性和规则库规模上优于其他可解释分类器。

Compact Rule Classifier Learning Based on Gradient Descent

BriefGPT - AI 论文速递 ·

本研究提出了一种新机制，将线性自注意力与GLU前馈层结合，使变换器在多项式核回归任务中有效进行梯度下降，强调模型规模对二次上下文学习的重要性。

Context Learning for Polynomial Kernel Regression in Transformers with GLU Layers

BriefGPT - AI 论文速递 ·

理解机器学习模型的学习过程：从基础到基础模型（2）

DEV Community ·

本文分析了机器学习中去除已训练模型数据的技术问题，提出了一种新的强健且带噪声的梯度下降变体，显著降低了去学习的时间复杂性，尤其在处理与保留数据显著不同的样本时。

The Utility and Complexity of Machine Unlearning: Challenges in and out of Distribution

BriefGPT - AI 论文速递 ·

本研究分析了逻辑回归和梯度下降在分类问题中的不足，特别是大步长的影响。提出了“归一化逻辑回归+梯度下降”方法，以提升收敛速度和理论保障。

From Logistic Regression to Perceptron Algorithm: Exploring the Impact of Large Step Sizes in Gradient Descent

BriefGPT - AI 论文速递 ·

梯度下降如何推动机器学习模型

DEV Community ·

批量、小批量与随机梯度下降

DEV Community ·

逻辑回归

DEV Community ·

线性回归：从理论到实践

DEV Community ·

本文研究了可行性泵算法在混合整数线性问题中寻找可行解的有效性。通过将其视为特定参数下的梯度下降算法，提出了改进的梯度更新和损失函数的方法，显著提升了性能并减少了迭代次数。

可微分可行性泵

BriefGPT - AI 论文速递 ·

本研究提出了一种双线性序列回归（BSR）模型，旨在改善高维标记长序列建模的不足。该模型简化了学习过程，并引入消息传递算法以优化性能，发现梯度下降算法在BSR模型中具有意想不到的特性。

Bilinear Sequence Regression: A Model for Learning High-Dimensional Labeled Long Sequences

BriefGPT - AI 论文速递 ·

本研究探讨了过参数化张量分解中的隐式正则化，提出一种新方法，证明小随机初始化下的梯度下降能引导模型趋向低管状秩解，从而提升图像数据建模性能。

通过梯度下降的管状张量分解的隐式正则化

BriefGPT - AI 论文速递 ·