量子位 ·

跳过“逐字生成”！蚂蚁集团赵俊博：扩散模型让我们能直接修改Token | MEET2026

💡 原文中文，约4500字，阅读约需11分钟。

📝

内容提要

蚂蚁集团赵俊博在MEET2026大会上介绍了扩散模型的优势，指出其可直接修改token，从而提升生成速度和降低计算成本。他们开源了LLaDA 2.0，首次实现千亿参数的扩散语言模型，引发行业关注。

🎯

🔎

扩散模型在生成速度和计算成本上具有明显优势，能够直接修改token而无需重新生成整段内容。然而，该技术仍处于早期发展阶段，面临数据需求大和扩展性挑战。未来的研究将需要解决这些问题，以实现更广泛的应用。

蚂蚁集团开源的LLaDA 2.0标志着扩散语言模型的一个重要里程碑，首次实现千亿参数规模。这不仅推动了技术的进步，也为研究社区提供了宝贵的资源，促进了行业内的合作与创新。

扩散模型与自回归模型在生成机制上存在显著差异。扩散模型采用“完形填空”式的解码方式，能够更灵活地处理生成任务。这种方法在某些应用场景中可能更具优势，尤其是在需要快速响应的任务中。

❓

扩散模型可以直接修改和控制token，从而提升生成速度和降低计算成本。

LLaDA 2.0是首个实现千亿参数的扩散语言模型，并且已开源。

扩散模型的解码过程类似于完形填空，而自回归模型则是逐步生成内容。

扩散模型对数据的需求更大，能够更快吸收数据。

蚂蚁集团致力于推动扩散语言模型的研究与应用，期待与社区共同发展。

扩散模型的Scaling Law与自回归模型存在显著差异，扩展到千亿规模面临新挑战。

🏷️