量子位 ·

跳过“逐字生成”！蚂蚁集团赵俊博：扩散模型让我们能直接修改Token | MEET2026

💡 原文中文，约4500字，阅读约需11分钟。

📝

内容提要

蚂蚁集团赵俊博在MEET2026大会上介绍了扩散模型的优势，指出其可直接修改token，从而提升生成速度和降低计算成本。他们开源了LLaDA 2.0，首次实现千亿参数的扩散语言模型，引发行业关注。

🎯

❓

扩散模型可以直接修改和控制token，提升生成速度和降低计算成本，且在相同计算量下所需参数规模更小。

LLaDA 2.0是首个实现千亿参数的扩散语言模型，开源后引发行业关注。

扩散语言模型的解码过程类似于完形填空，通过遮盖部分词汇再进行恢复，而非逐步生成。

蚂蚁集团致力于推动扩散语言模型的研究与应用，探索其独特的Scaling Law。

扩散模型在数据需求上更大，能够更快吸收数据，表现出更强的“data-hungry”特性。

扩散模型的Scaling Law与自回归模型存在差异，扩展到千亿规模面临新挑战。

🏷️

每天烧 120 万亿 Token，这是 AI 圈最新的凡尔赛
火山引擎数据显示，豆包大模型日均Token使用量已达120万亿，较三个月前翻倍。中国日均Token调用量突破140万亿，增长超千倍，主要受AI视频创作和智...
豆包大模型日均Token使用量超120万亿，Seedance 2.0 API开启公测
火山引擎于4月2日宣布Seedance 2.0 API进入企业用户公测，提供版权与肖像安全保障。豆包大模型日均Token使用量已超过120万亿，主要受AI...
BBC、法国电视集团和Haivision等公司呼吁实现5G直播的互操作性
广播行业呼吁移动运营商消除5G应用障碍，支持CAMARA QoD API以优化网络性能。标准化API将提升直播质量，确保关键数据流优先级，预计2026年在...
这家自行车架先锋公司正在出售蓝牙吸盘，将自行车固定在您的汽车上
Richard Allen didn't invent the automobile bike rack - his 1967 patent ap...
KernelEvolve：Meta的排名工程师代理如何优化AI基础设施
This is the second post in the Ranking Engineer Agent blog series exploring t...
Anthropic的艰难一周：泄露的模型、暴露的源代码以及失败的GitHub下架
Anthropic’s had a rough streak of luck lately. Last week, Fortune reported o...