小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
北大团队改造DeepSeek注意力,速度快四倍还不丢精度

北京大学团队提出的新稀疏注意力机制HISA,速度提升2-4倍,几乎不损失精度。该机制通过块级粗过滤和块内精挑字符,降低索引器成本,适应超长文本需求,工程友好性强。测试结果显示HISA在速度和精度上表现优异,未来可进一步优化块特征计算和训练方式。

北大团队改造DeepSeek注意力,速度快四倍还不丢精度

量子位
量子位 · 2026-04-06T15:25:48Z

美团龙猫LongCat推出新稀疏注意力机制LoZA,解码速度提升10倍,支持处理1M长文本。通过优化模型结构,降低计算复杂度,提高效率,同时保持稳定性能。该技术在长文本任务中优于同类模型,未来将支持动态稀疏比例,以适应不同场景需求。

美团龙猫LongCat技术升级!新注意力机制解码速度快10倍,还能处理1M超长文本

量子位
量子位 · 2026-01-13T04:30:50Z
DeepSeek-V3.2在推理任务上超越GPT-5

DeepSeek发布了DeepSeek-V3.2开源AI模型,性能超过GPT-5,采用稀疏注意力机制和强化学习等新技术。尽管表现优异,但在知识广度和复杂任务解决上仍不及封闭模型,未来将致力于优化模型效率和知识积累。

DeepSeek-V3.2在推理任务上超越GPT-5

InfoQ
InfoQ · 2026-01-06T14:00:00Z
神经推理的蜕变:从概率解码到 DeepSeek V3.2 的理性智能体架构演进 - 张善友

DeepSeek V3.2 通过引入“系统 2”推理机制,重构了大型语言模型的解码策略,强调实时计算和思维链生成。其核心技术包括稀疏注意力机制和强化学习,提升了模型在复杂任务中的表现,标志着人工智能向理性智能体的演进。

神经推理的蜕变:从概率解码到 DeepSeek V3.2 的理性智能体架构演进 - 张善友

张善友
张善友 · 2025-12-14T01:42:00Z

DeepSeek 的闪电索引器通过计算索引分数提高模型效率,解决了全书阅读的 $O(L^2)$ 复杂度问题。它筛选出与当前查询相关的 Top-k token,将注意力复杂度降低到 $O(L k)$,显著提升计算效率。

deepseek-v3.2-exp的闪电索引器

鸟窝
鸟窝 · 2025-09-30T16:00:00Z

九章云极推出DeepSeek-V3.2-Exp模型,采用稀疏注意力架构,降低计算复杂度,提升推理性能。该模型支持一键私有化部署,确保企业数据安全与合规。Alaya NeW智算云平台提供高性能计算资源,满足多场景需求,推动AI应用普及。

九章云极率先完成DeepSeek-V3.2-Exp适配,提供安全高效部署方案

量子位
量子位 · 2025-09-30T08:04:47Z
vLLM中的DeepSeek-V3.2-Exp:细粒度稀疏注意力的应用

DeepSeek-V3.2-Exp模型现已支持,采用稀疏注意力机制,适用于长文本任务。vLLM集成了新的CUDA内核,优化了性能,用户可通过特定指令进行部署和测试,未来将扩展对更多硬件的支持。

vLLM中的DeepSeek-V3.2-Exp:细粒度稀疏注意力的应用

vLLM Blog
vLLM Blog · 2025-09-29T00:00:00Z
小红书dots.llm1:重新定义MoE效率边界,14B激活参数挑战72B密集模型极限

本文介绍了一种新型极简激活超级大脑模型,参数总数为142B,动态激活为14B,训练成本仅为Qwen2.5-72B的1/4。该模型在中文理解、数学推理和代码生成等任务中表现优异,并开源了训练过程,强调数据质量和系统创新的重要性。未来将探索稀疏注意力和模拟人类学习效率。

小红书dots.llm1:重新定义MoE效率边界,14B激活参数挑战72B密集模型极限

我爱自然语言处理
我爱自然语言处理 · 2025-06-11T02:53:07Z

清华大学与面壁智能团队推出的MiniCPM 4模型,提供0.5B和8B参数规模,训练开销仅为22%。该模型在长文本处理上实现5倍加速,采用稀疏注意力架构,性能超越多款同类模型,适合端侧设备,具备高效推理能力。

0.5B以小搏大拿下端侧模型新SOTA:4090可跑,长文本处理5倍常规加速丨清华&面壁开源

量子位
量子位 · 2025-06-10T07:48:29Z

本研究提出广义邻域注意力(GNA)模型,以提高稀疏注意力机制的速度。通过在NVIDIA Blackwell架构上实现,GNA在多个生成模型中验证了28%至46%的速度提升,有效解决了注意力机制的O(n^2)复杂性问题。

Generalized Neighborhood Attention: Multidimensional Sparse Attention at the Speed of Light

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z
清华稀疏Attention,无需训练加速一切模型!

清华大学陈键飞团队提出的稀疏注意力机制SpargeAttn,无需训练即可加速多种模型,推理速度提升4-7倍,同时保持端到端精度,有效解决长序列任务的计算瓶颈。

清华稀疏Attention,无需训练加速一切模型!

机器之心
机器之心 · 2025-03-27T02:28:37Z

本研究提出了XAttention框架,旨在解决长上下文变换器模型的计算成本问题。通过稀疏注意力加速推理,利用反对角值之和作为块重要性代理,实现高效的块识别与剪枝,最终实现高达13.5倍的计算加速。

XAttention: Block Sparse Attention with Antidiagonal Scoring

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z
在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架

清华大学等机构提出APB框架,利用稀疏注意力机制显著提升长文本推理效率,速度比传统方法快10倍,有效解决长距离语义依赖问题,适用于大模型服务。

在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架

机器之心
机器之心 · 2025-03-12T02:31:33Z
稀疏注意力再添一员,华为诺亚推出高效选择注意力架构ESA

华为诺亚方舟实验室发布的新ESA算法通过稀疏注意力设计,突破了大模型在长文本处理中的瓶颈,显著提升了计算效率和性能。ESA通过低维压缩和动态选择关键token,降低了计算复杂度,适用于长序列任务,实验结果显示其在多项基准测试中优于传统方法。

稀疏注意力再添一员,华为诺亚推出高效选择注意力架构ESA

机器之心
机器之心 · 2025-02-24T09:05:15Z
Qwen2.5-1M: 支持100万Token上下文的开源Qwen模型

Qwen2.5-1M模型正式发布,支持1M上下文长度,包含两个新开源模型。推理框架速度提升3-7倍,长文本任务表现优于128K版本,短文本任务性能保持稳定。模型采用稀疏注意力和长度外推技术,优化推理效率,未来将继续提升性能和应用范围。

Qwen2.5-1M: 支持100万Token上下文的开源Qwen模型

Blog on Qwen
Blog on Qwen · 2025-01-26T16:00:03Z

本研究提出差异注意力机制,通过计算两个独立softmax注意力图的差异,减少噪声,促进稀疏注意力模式,解决变换器在处理无关上下文时的注意力分配问题。实验表明,差异变换器在语言建模、长上下文建模和信息检索方面优于传统变换器。

差异变换器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文介绍了加快语言大模型推理速度的综合指南,包括分阶段推测性解码、指导性生成、前向解码和提示查找解码等优化策略。同时提到了稀疏注意力和非Transformer架构等训练时间优化方法。随着硬件改进和推理优化技巧的发展,语言大模型的性能将不断提升。

语言大模型推理加速指南

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-01-31T01:31:16Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码