小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了在正交约束下求解非方阵最速下降方向的方法,提出了一种基于迭代算法的解决方案,涉及矩阵谱范数和切空间的概念。通过数值算法和奇异值分解(SVD)技术,解决了优化问题,并比较了不同方法的效果。

流形上的最速下降:3. Muon + Stiefel

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-08-08T05:08:00Z

本文探讨大型语言模型在算法设计中的应用,特别是在迭代算法搜索中的适应性。通过图形分析,揭示了LLM辅助算法搜索的多模态特性,为组合优化任务提供有效指导。

大型语言模型辅助自动化算法搜索的适应性景观

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-28T00:00:00Z

本研究针对化学基础模型(CFM)在数据分布和训练过程中的负载均衡问题,提出了一种迭代算法,将数据分布视为多目标装箱问题,从而实现高效数据分配。同时,优化了MACE模型中的对称张量收缩内核,显著提高训练速度,周期执行时间从12分钟缩短至2分钟。

优化数据分布和内核性能,以高效训练化学基础模型:以MACE为例

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本文介绍了一种内存高效适应预训练语言模型的方法,通过迭代算法将预训练矩阵分解为高精度低秩部分和内存高效的量化部分。在微调过程中,只更新低秩部分,量化部分保持固定。通过整数线性规划形式动态配置量化参数,实现在总体存储器预算下的量化。实验结果表明,该方法在适应不同模型时优于其他基准方法,并能实现更激进的量化。

L4Q:大型语言模型的参数高效量化感知训练:基于 LoRA-wise LSQ

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-07T00:00:00Z

该研究提出了一种迭代算法,通过联合识别神经网络表示中的两个低维正交子空间来分离与主要任务无关的概念,以解决概念相关性对于网络的超出分布泛化的不利影响。该算法在计算机视觉和自然语言处理的基准数据集上表现优于现有的概念去除方法。

通过联合子空间估计从神经网络表示中去除虚假概念

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-18T00:00:00Z

该文提出了一种离群点检测方法恢复基于生成模型的信号的迭代算法,适用于线性和非线性生成型神经网络,能够成功地在离群点存在的情况下重建信号。

使用具备理论性能保证的生成模型进行离群点检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-16T00:00:00Z

该文介绍了一种新的选择性学习理论,用于高噪声数据分布下的学习和决策。通过最小化损失函数来区分有用数据和无用数据进行预测,并描述了一个迭代算法,同时优化预测器和选择器。实证表现良好。

学习放弃无信息数据

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码