小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
LWiAI播客第238期 - GPT 5.4迷你版、OpenAI转型、Mamba 3、注意力残差

本期节目讨论了最新的AI新闻,包括OpenAI的GPT-5.4发布、Mistral新模型、Meta与Nvidia的AI代理竞争,以及各大公司的业务与安全动态。

LWiAI播客第238期 - GPT 5.4迷你版、OpenAI转型、Mamba 3、注意力残差

Last Week in AI
Last Week in AI · 2026-04-01T08:07:15Z

Mamba是一种新型选择性状态空间模型,优化了长序列数据处理,推理速度比Transformer快5倍,支持跨模态应用。Rust实现的Mamba-RS具备高效的推理和训练能力,并支持CUDA加速,适用于多种场景。

【Rust日报】2026-03-21 Mamba-RS: Rust实现的Mamba选择性状态空间模型

Rust.cc
Rust.cc · 2026-03-27T06:34:15Z

遇到Mamba环境安装问题时,可以下载离线whl文件并用pip安装,确保用官方项目的mamba_ssm替换conda环境中的版本。环境安装和模块实例化已完成,近期将分享Mamba理论。

【Triton 教程】triton_language.ceil

HyperAI超神经
HyperAI超神经 · 2026-02-25T07:46:05Z
Vision Mamba (Vim)笔记

Vision Mamba (Vim)与Vision Transformer (ViT)相似,但实现细节不同。Vim采用双向扫描机制,克服了单向读取的局限性。其Mamba层设计为成对结构,通过前向和后向层处理图像Patch,增强了模型的全局可见性。

Vision Mamba (Vim)笔记

plus studio
plus studio · 2026-01-08T00:00:00Z
Mamba作者团队提出SonicMoE:一个Token舍入,让MoE训练速度提升近2倍

AI短名单是对人工智能领域中重要项目或技术的简要概述,旨在突出其关键特征和影响。

Mamba作者团队提出SonicMoE:一个Token舍入,让MoE训练速度提升近2倍

机器之心
机器之心 · 2025-12-19T07:02:33Z

CompressARC研究表明,未经过预训练的76K参数模型在ARC-AGI-1基准上解决了20%的问题,挑战了智能依赖大规模预训练的假设。该方法仅利用谜题本身,实现了对ARC-AGI谜题的泛化求解。

无预训练模型拿下ARC-AGI榜三!Mamba作者用压缩原理挑战Scaling Law

量子位
量子位 · 2025-12-16T06:59:31Z
IBM新推出的Granite 4模型:采用高效推理的混合Mamba-2架构,降低人工智能成本

IBM推出Granite 4.0小型语言模型系列,采用混合Mamba/变换器架构,显著降低内存需求和运行成本,同时保持高准确性。Granite提供三种模型变体,适用于不同场景,支持高效推理和长输入处理,已在Hugging Face和watsonx.ai上开源,并获得ISO/IEC 42001:2023认证。

IBM新推出的Granite 4模型:采用高效推理的混合Mamba-2架构,降低人工智能成本

InfoQ
InfoQ · 2025-11-18T02:48:00Z

苹果的新研究表明,基于状态空间模型的Mamba在Agent任务中超越了Transformer,具备更高的效率和泛化能力。Mamba通过持续更新内部状态,计算量线性增长,支持流式处理且内存占用稳定。引入外部工具后,Mamba在复杂任务中的表现显著提升,显示出在Agent场景中有潜力取代Transformer。

苹果AI选Mamba:Agent任务比Transformer更好

量子位
量子位 · 2025-10-21T06:01:35Z

NVIDIA推出了轻量级大语言模型Nemotron-Nano-9B-v2,结合Mamba和Transformer技术,支持128K超长上下文,推理能力强,适合小型设备。该模型在准确率和吞吐量上优于同规模的开源模型,标志着轻量化部署的突破。

在线教程丨英伟达力推小模型,小而精的Nemotron-Nano-9B-v2比Qwen3快6倍

HyperAI超神经
HyperAI超神经 · 2025-08-29T03:35:54Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。

无Tokenizer时代真要来了?Mamba作者再发颠覆性论文,挑战Transformer

机器之心
机器之心 · 2025-07-12T13:34:06Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。

「Tokens是胡扯」,Mamba作者抛出颠覆性观点,揭露Transformer深层缺陷

机器之心
机器之心 · 2025-07-10T02:48:05Z

Mamba探讨了状态空间模型(SSMs)与Transformer的优劣,指出Attention并非万能,SSMs在处理长序列信息时更具优势。Mamba在同规模下超越Transformer,强调混合模型的潜力,未来可能结合两者优势开发新架构。

Mamba一作预告新架构!长文论述Transformer≠最终解法

量子位
量子位 · 2025-07-09T05:14:41Z
理解Mamba中的输入选择性

Mamba是一种新兴的状态空间模型,改进了输入选择性、卷积和门控功能。研究表明,Mamba在函数近似、长期记忆和联想回忆方面表现优越,尤其在处理不连续函数时优于S4D。

理解Mamba中的输入选择性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-04T00:00:00Z

普林斯顿大学与Meta合作推出LinGen框架,通过MATE模块将视频生成复杂度降低至线性,显著提升生成效率。LinGen在视频质量上优于DiT,生成速度最高可加速15倍,且适应性强,能处理更长的token序列。

单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta

量子位
量子位 · 2025-06-18T08:23:59Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

2025谷歌研究学者计划名单:吴佳俊、Mamba作者Albert Gu、Tri Dao等获奖

机器之心
机器之心 · 2025-06-13T09:47:33Z

Mamba核心作者Tri Dao提出了两种新注意力机制GTA和GLA,旨在优化推理,解码速度和吞吐量提升2倍,同时减少内存使用,保持模型性能,解决长上下文推理中的内存和计算瓶颈问题。

Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造

量子位
量子位 · 2025-06-01T04:51:34Z

该研究提出了一种新颖的SAMA-UNet架构,旨在提高医学图像分割效率。其创新点在于自适应美洲蛇聚合注意力块,通过动态权重调整优先处理最相关特征。实验结果表明,SAMA-UNet在MRI、CT及内窥镜图像分割精度上优于现有模型。

SAMA-UNet: Enhancing Medical Image Segmentation with Self-Adaptive Mamba-Like Attention and Causal Resonance Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究提出了$ ext{B}_2 ext{S}_6$模型,以解决Mamba在长序列任务中的不足。该模型结合块选择动态和通道特定偏差,显著提升了性能,超越了S4和S4D,同时保持了语言建模效果。

Block-Derived Mamba for Long-Term Sequence Processing

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

该研究提出了一种基于Transformer-Mamba模块和可学习小波变换的扩散模型,将符号音乐表示为钢琴卷轴,显著提高了音乐生成的质量和可控性。

Learnable Wavelet Mamba Diffusion Model for Controllable Symbolic Music Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

本研究首次在Mamba模型中有效整合早期退出机制,利用DYNAMAX框架提升计算效率,适用于嵌入式和资源受限环境。

Dynamic Computing: DYNAMAX Based on Transformer and Mamba Architecture

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码