小红花·文摘

本文探讨了在正交约束下求解非方阵最速下降方向的方法，提出了一种基于迭代算法的解决方案，涉及矩阵谱范数和切空间的概念。通过数值算法和奇异值分解（SVD）技术，解决了优化问题，并比较了不同方法的效果。

流形上的最速下降：3. Muon + Stiefel

科学空间|Scientific Spaces ·

本文探讨大型语言模型在算法设计中的应用，特别是在迭代算法搜索中的适应性。通过图形分析，揭示了LLM辅助算法搜索的多模态特性，为组合优化任务提供有效指导。

大型语言模型辅助自动化算法搜索的适应性景观

BriefGPT - AI 论文速递 ·

本研究针对化学基础模型（CFM）在数据分布和训练过程中的负载均衡问题，提出了一种迭代算法，将数据分布视为多目标装箱问题，从而实现高效数据分配。同时，优化了MACE模型中的对称张量收缩内核，显著提高训练速度，周期执行时间从12分钟缩短至2分钟。

优化数据分布和内核性能，以高效训练化学基础模型：以MACE为例

BriefGPT - AI 论文速递 ·

本文提出了一种简化的迭代算法，解决数据分析中的规范相关分析和广义特征向量问题。该算法具有全局线性收敛性和可行的时间复杂度，适用于大规模矩阵。研究还探讨了基于博弈理论的Top-k模型、结合坐标选择的PCA特征向量估计及分布式PCA算法，展示了在高维数据集和流式数据下的有效性。

基于广义特征值问题的数据协作分析的新解决方案

BriefGPT - AI 论文速递 ·

本文介绍了一种内存高效适应预训练语言模型的方法，通过迭代算法将预训练矩阵分解为高精度低秩部分和内存高效的量化部分。在微调过程中，只更新低秩部分，量化部分保持固定。通过整数线性规划形式动态配置量化参数，实现在总体存储器预算下的量化。实验结果表明，该方法在适应不同模型时优于其他基准方法，并能实现更激进的量化。

L4Q：大型语言模型的参数高效量化感知训练：基于 LoRA-wise LSQ

BriefGPT - AI 论文速递 ·

该研究提出了一种迭代算法，通过联合识别神经网络表示中的两个低维正交子空间来分离与主要任务无关的概念，以解决概念相关性对于网络的超出分布泛化的不利影响。该算法在计算机视觉和自然语言处理的基准数据集上表现优于现有的概念去除方法。

通过联合子空间估计从神经网络表示中去除虚假概念

BriefGPT - AI 论文速递 ·

该文提出了一种离群点检测方法恢复基于生成模型的信号的迭代算法，适用于线性和非线性生成型神经网络，能够成功地在离群点存在的情况下重建信号。

使用具备理论性能保证的生成模型进行离群点检测

BriefGPT - AI 论文速递 ·

该文介绍了一种新的选择性学习理论，用于高噪声数据分布下的学习和决策。通过最小化损失函数来区分有用数据和无用数据进行预测，并描述了一个迭代算法，同时优化预测器和选择器。实证表现良好。

学习放弃无信息数据

BriefGPT - AI 论文速递 ·