小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
一分钟读论文:《归一化计算下单Agent为何优于多Agent》

斯坦福大学的研究表明,在多跳推理任务中,单Agent系统的表现优于多Agent系统,尤其在计算量相同的情况下。研究指出,多Agent系统的优势主要来自于token数量的增加,而非架构本身的提升。这一发现对AI工程实践具有重要指导意义,建议在固定计算量时优先考虑单Agent架构。

一分钟读论文:《归一化计算下单Agent为何优于多Agent》

Micropaper
Micropaper · 2026-04-18T00:00:00Z
参数与FLOPs:混合专家语言模型的最佳稀疏性扩展规律

研究表明,扩大语言模型的容量可以提升性能,主要通过增加模型参数和计算量来实现。稀疏专家混合模型(MoEs)在不显著增加计算量的情况下扩展参数数量。研究发现,在不同约束条件下,存在最佳稀疏水平,能够提高训练效率和模型性能,从而为MoEs的扩展提供了更深入的理解。

参数与FLOPs:混合专家语言模型的最佳稀疏性扩展规律

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-07T00:00:00Z

本文提出了一种自适应计算剪枝方法(ACP),有效解决遗忘变换器中注意力头快速遗忘的问题。研究表明,ACP可减少约70%的计算量,提高训练吞吐量10%至35%,在长上下文中效果更为显著,且性能保持稳定。

遗忘变换器的自适应计算剪枝

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

减治法是一种算法模式,通过利用较小实例的解来简化复杂问题,主要包括减去常量、减去常量因子和可变规模减小三种形式。该方法广泛应用于计算最大公约数和幂函数等问题,有效降低计算量。

算法模式:减治法

"地瓜哥"博客网
"地瓜哥"博客网 · 2025-04-06T15:32:03Z
AI模型学习何时跳过图像处理,计算量减少30%且不影响性能

研究表明,AI模型通过伪Q学习框架动态调整图像处理,能在视觉任务中减少30%的计算量,且对性能影响最小。该方法利用上下文感知标记,帮助模型决定何时跳过图像处理。

AI模型学习何时跳过图像处理,计算量减少30%且不影响性能

DEV Community
DEV Community · 2025-03-22T07:13:43Z
万字长文解读Scaling Law的一切,洞见LLM的未来

Cameron R. Wolfe探讨了Scaling Law在AI研究中的影响,分析了其对大型语言模型(LLM)性能的作用。尽管Scaling Law推动了AI的发展,但顶级实验室面临瓶颈,需寻找新路径。文章强调数据和计算量的重要性,并提出未来研究方向。

万字长文解读Scaling Law的一切,洞见LLM的未来

机器之心
机器之心 · 2025-02-01T11:58:09Z

本研究探讨了语言模型中参数数量与计算量之间的关系,重点分析了稀疏混合专家模型的稀疏性对性能的影响。研究表明,优化稀疏性能够提升训练效率和模型性能,为设计更高效的架构提供了新视角。

Parameters vs FLOPs: Scaling Laws for Optimal Sparsity in Mixture-of-Experts Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-21T00:00:00Z

本研究提出了一种新方法,将基于注意力的多变量时间序列预测模型简化为多层感知机(MLP),通过前馈、跳跃连接和层归一化操作实现。结果显示,该方法显著降低了计算量,同时保持了可接受的性能,展示了其高效性和可行性。

Approximate Attention with MLP: A Pruning Strategy for Attention-Based Multivariate Time Series Forecasting Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z
profile a deep learning model

本文讨论了程序性能分析的方法,包括计时、内存分析和使用工具。还介绍了评估深度学习模型性能的方法,包括计算量和参数量的计算。提供了FlopCountAnalysis、torch profiler和deepspeed等工具和代码示例。同时介绍了thop和stat等其他工具。

profile a deep learning model

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2024-07-30T07:34:36Z
黎曼ζ函数零点密度定理的计算外包讨论

在计算机辅助证明和纯人类可读证明之间存在平衡。纯人类可读证明需要最小化计算量,而计算机辅助证明可以将验证任务外包给计算机。这两种方法都有优势,没有一种一定比另一种更好。

黎曼ζ函数零点密度定理的计算外包讨论

What's new by TerryTao
What's new by TerryTao · 2024-07-08T00:11:02Z

本文提出了一种基于预测编码模型的时间注意机制,通过在无法预测时关注视觉事件,减少能耗和计算量。研究表明,该机制可将数据通信量减少46.7%,计算活动减少43.8%。此外,介绍了新颖的神经网络架构和自监督学习方法,提升了视频字幕生成、眼动追踪和光流估计等任务的性能。

暗环境下采用时间编码事件驱动神经网络的注视向量估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

该研究提出了一种名为PAUMER的方法,通过在最终解码器之前暂停对不再需要计算的路径进行计算来提高分割变换器效率。该方法使用预测熵作为暂停的准则,并可以通过调整暂停参数轻松地适应各种运行时要求。在两个标准分割数据集上展示了该方法的效果,吞吐量提高了约50%。

PAUMER: 语义分割的补丁暂停转换器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-01T00:00:00Z

该文介绍了一种构建置信区间的方法,通过多个随机梯度下降和在线方法实现,避免了现有分批方法中的复杂混合条件,减少计算量。

高效不确定性量化:简易重采样随机梯度下降

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-17T00:00:00Z

该文介绍了深度模型在推断计算方面的进展,但指出了普适性对抗贴片攻击的影响。攻击者通过优化贴片,将其粘贴到图像上可以增加模型计算量和功耗。标准对抗性训练防御方法可以减少攻击成功率,但需要采用自适应高效的方法降低深度模型功耗,并开发更好的防御方法。

归因修补优于自动电路发现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-16T00:00:00Z

该文介绍了深度模型在推断计算方面的进展,但指出这些模型容易受到对抗贴片攻击的影响。攻击者通过优化一个贴片,将其粘贴到任意图像上可以增加模型的计算量和功耗。作者运行实验使用了三种不同的高效视觉转换器方法,显示在某些情况下,攻击者只需将一个只占图像面积的 8% 的贴片粘贴上即可将计算量增加到最大限度。同时,作者还展示了标准对抗性训练防御方法可以减少攻击的成功率。作者呼吁未来需要采用自适应高效的方法来降低深度模型的功耗,并开发更好的防御方法来对抗这种攻击。

SlowFormer:面向计算与能量效率的通用敌对修补攻击 —— 对推理高效视觉转换器的攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-04T00:00:00Z

PyTorch提供多种方法降低计算成本和计算量,如压缩模型、分布式训练、硬件加速和模型量化。使用PyTorch的C++ API和TorchScript可以实现大语言模型,通过加载模型、准备数据、将数据转换为张量、将张量送入模型并计算输出等步骤完成。

pytorch模型降低计算成本和计算量 - Xu_Lin

Xu_Lin
Xu_Lin · 2023-05-02T14:26:00Z

ChatGPT和视觉Transformer都使用token作为最小单位,ChatGPT的token大概为3/4的一个单词,而视觉Transformer把图片拆分成一个个patch,每个patch看作是一个token,以减少计算量。

Transformer中的token - 蝈蝈俊

蝈蝈俊
蝈蝈俊 · 2023-03-03T23:48:00Z
模型推理速度影响因素分析

模型推理速度受计算量、参数量、访存量和内存占用等多因素影响。计算量越大,推理时间通常越长;访存量影响存储带宽需求。计算密度和RoofLine模型用于评估性能上限,访存密集型和计算密集型算子各具特点。综合评估需考虑硬件特性、系统环境及软件实现,实际性能需通过真机测试。

模型推理速度影响因素分析

李文举
李文举 · 2022-02-27T10:20:08Z
人工智能与效率

自2012年以来,训练神经网络达到ImageNet分类相同性能所需的计算量每16个月减少一半。与2012年相比,训练达到AlexNet水平的计算量减少了44倍,表明算法进步超过了传统硬件效率。

人工智能与效率

OpenAI
OpenAI · 2020-05-05T07:00:00Z
人工智能与计算

自2012年以来,AI训练所需的计算量以每3.4个月增长超过30万倍,计算能力的提升是AI进步的关键,未来可能出现超出当前能力的系统。

人工智能与计算

OpenAI
OpenAI · 2018-05-16T07:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码