小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
DeepSeek V4最大的遗憾

Engram是DeepSeek与北大联合开源的知识查找模块,旨在提升大模型的记忆与效率。尽管在DeepSeekV4中未出现,Engram的理念和应用仍在发展。研究表明,Engram通过优化Transformer结构,提升了模型的推理能力和知识检索效率,显示出在内存管理和视觉任务中的潜力。

DeepSeek V4最大的遗憾

量子位
量子位 · 2026-05-03T03:43:37Z

Meta与多所大学合作提出了一种元认知复用机制,通过回顾推理过程提炼简洁的“行为”,显著减少推理token使用量,最多可减少46%。该方法在数学测试中保持准确率不变,提升了模型的推理效率。

推理token减少46%!Meta新方法缩短思维链,告别重复推导

量子位
量子位 · 2025-10-05T08:59:54Z

OpenAI的gpt-oss模型采用MXFP4数据类型,推理成本降低75%,速度提升4倍。80GB显卡可运行1200亿参数模型,16GB显卡可运行200亿参数。MXFP4通过压缩权重和提高内存带宽,显著提升模型效率。

推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型

量子位
量子位 · 2025-08-11T07:13:35Z
计算机视觉前沿:深度人工智能时代的可解释性、效率、鲁棒性与统一学习

本文总结了2025年5月10日发布的十六篇计算机视觉研究论文,重点讨论了可解释性、弱监督学习、模型效率和安全性等主题。这些研究推动了计算机视觉的理论与实践发展,并促进了其在医疗和安防等领域的应用。

计算机视觉前沿:深度人工智能时代的可解释性、效率、鲁棒性与统一学习

DEV Community
DEV Community · 2025-05-13T07:49:56Z

本研究分析了MILS框架在零-shot图像标题生成中的高计算成本,揭示了其多步骤迭代过程的开销,并比较了BLIP-2和GPT-4V等模型的效率,质疑了零-shot性能无需大量资源投入的观点。

Zero-Shot, But at What Cost? Unveiling the Hidden Costs of the MILS LLM-CLIP Framework in Image Captioning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z

本研究探讨了DP-SGD训练中噪声对梯度方向的负面影响,提出了几何扰动策略GeoDP,显著提高模型效率,减少方向噪声,同时确保隐私保护。实验结果表明,该方法在多个数据集和模型上均有效。

技术报告:分析和优化 DP-SGD 扰动的完整版本

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z

本研究提出M2IV方法,以解决大型视觉语言模型中的多模态上下文学习挑战。通过引入可学习的上下文向量,增强了模型的表示能力。实验结果显示,M2IV在多个基准测试中平均准确率提高了3.74%,且效率显著提升。

M2IV:朝着高效且细粒度的多模态上下文学习在大型视觉语言模型中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-06T00:00:00Z
加州大学伯克利分校的Sky Computing Lab推出了降低AI语言模型推理成本的模型

加州大学伯克利分校的Sky Computing Lab发布了Sky-T1-32B-Flash模型,旨在解决AI过度思考的问题。该模型通过优化生成简洁回答,降低推理成本,提高数学、编程和科学领域的准确性。研究团队采用三阶段方法,减少输出长度,同时保持性能,显著提升模型效率。

加州大学伯克利分校的Sky Computing Lab推出了降低AI语言模型推理成本的模型

InfoQ
InfoQ · 2025-02-19T11:08:00Z

本文提出M因子指标,旨在解决神经架构搜索(NAS)方法过于关注准确性而忽视模型效率的问题。M因子结合了模型的准确性和大小,适用于资源受限环境,特别是移动设备和边缘计算系统。

M-Factor: A Novel Metric for Evaluating Neural Architecture Search in Resource-Constrained Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z

Meta AI 的“记忆层”技术通过引入可学习的记忆模块,提升了语言模型在事实性知识处理上的性能。该技术模拟人脑记忆机制,使用键值对存储知识,优化信息检索。实验表明,记忆层显著提高了模型效率,未来可探索更高效的知识编码和动态更新机制。

Meta AI 的“记忆层”技术详解 - 蝈蝈俊

蝈蝈俊
蝈蝈俊 · 2025-01-20T09:08:00Z

本研究探讨了多语言模型在爱沙尼亚语中的适应性。调整词汇后,重训练词汇器降低了命名实体识别性能,但删除未使用标记未产生负面影响,反而提升了模型效率。

Trimming or Retraining: Optimizing Vocabulary for Multilingual Models in Estonian

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-05T00:00:00Z

本研究通过引入统一的神经符号系统和稀疏向量表示,解决了神经网络在组合推广中的不足,显著提升了模型效率和应用范围,同时保留了推广能力,避免了其他技术的缺陷。

Combinatorial Generalization in Distribution Changes under Sparse Tree Operations

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了VisionZip方法,旨在解决视觉语言模型中的视觉标记冗余问题。通过选择信息丰富的标记,VisionZip显著提高了模型的效率和性能,性能提升至少5%,推理速度显著提高,预填充时间提升8倍,具有广泛的应用潜力。

VisionZip: Longer is Not Necessarily Better in Vision Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本文提出了一种新算法——分阶段投机性解码,旨在加速小批量大型语言模型(LLM)的推断。该方法通过重组投机性批量为树结构并增加第二阶段解码,成功将解码延迟降低了3.16倍,同时保持输出质量。此外,研究还探讨了推测解码的训练方法,显著提高了模型的效率和性能。

高效推理方法的深入分析:投机解码的综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z

本研究探讨了知识蒸馏技术在提升大型语言模型效率中的应用。通过使用405B教师模型的输出训练更小的学生模型,发现合成数据显著提高了8B和70B模型的准确性,甚至在某些数据集上超越了405B模型的零-shot准确性,强调了合成数据质量的重要性。

Knowledge Distillation Using Cutting-edge Open-source Large Language Models: Generalizability and the Role of Synthetic Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

本研究探讨了大语言模型中的提示压缩方法,以解决长提示带来的内存和推理成本问题。比较了硬提示和软提示的技术,分析其机制,并提出未来的优化方向,表明提示压缩能显著提高模型效率。

Prompt Compression for Large Language Models: A Survey

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本研究提出了一种新颖的$(eta, eta)$-稀疏性概念,以提升群体分布鲁棒优化(GDRO)的模型有效性。通过创新算法,改善了抽样复杂度,使其对组数$K$的线性依赖转变为对较小的$eta$的线性依赖,从而显著提高了模型效率,并展示了一种自适应算法以适应最佳稀疏性条件。

Beyond Minimax Rates in Group Distributionally Robust Optimization: A Novel Notion of Sparsity

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-01T00:00:00Z

本文提出了一种系统化的分类方法,分析了大型语言模型(LLMs)的技术及应用前景,强调提高模型效率的必要性,并介绍了多语言模型框架、工具增强和混合推理方法等创新,以推动LLMs的发展和应用。

PolyRouter:一个多大型语言模型查询系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

本文介绍了多种神经网络量化方法,如阈值训练、梯度量化和自适应无数据量化。研究表明,量化能够在保持精度的同时提高模型效率,尤其适用于资源受限环境。提出的AdaQAT方法在训练过程中自动优化比特宽度,表现出色,具有竞争力。

RTF-Q:基于无监督领域适应的无重训量化网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-11T00:00:00Z

本文提出了一种图形神经网络认证卸载框架,解决复杂的卸载问题,优于传统方法。研究了数据隐私与遗忘概念,提出了 UtU 方法,以保持高准确性和隐私保护。同时介绍了 GraphRevoker 和 GraphEraser 框架,以提升模型的效用和效率。

IDEA: 图神经网络认证式遗忘性灵活框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码