量子位 ·

2025外滩大会：蚂蚁、人大发布首个原生MoE扩散语言模型，将于近期开源

💡 原文中文，约1700字，阅读约需5分钟。

📝

内容提要

蚂蚁集团与人民大学联合发布了首个原生MoE架构的语言模型LLaDA-MoE，经过20T数据训练，性能超越LLaDA1.0/1.5和Dream-7B，推理速度高效。该模型将于近期开源，推动全球AI技术发展。

🎯

❓

LLaDA-MoE模型是首个原生MoE架构的扩散语言模型，经过20T数据训练，性能超越LLaDA1.0/1.5和Dream-7B，推理速度高效。

LLaDA-MoE模型将于近期完全开源。

LLaDA-MoE在代码、数学、Agent等任务上表现优于LLaDA1.0/1.5和Dream-7B，且与Qwen2.5-3B-Instruct的性能相当。

LLaDA-MoE模型通过非自回归的掩码扩散机制进行训练，首次在大规模语言模型中实现了与Qwen2.5相当的语言智能。

蚂蚁集团将持续投入AGI领域，推动AGI的新突破，并计划与学界和全球AI社区共同合作。

LLaDA-MoE模型在约20T数据上完成了从零训练。

🏷️

为智能体可信协作提供新方案蚂蚁数科登顶以太坊全球基准评测
蚂蚁数科的零知识证明虚拟机zkDTVM在以太坊的EthProofs基准测试中将区块证明速度压缩至3.7秒，打破业界纪录，显示其区块链技术的全球领先地位。该...
Rivian’s revenue is up as R2 production kicks into gear
Rivian reported its first quarter earnings of 2026, providing us a closer loo...
Rivian downsizes its goals for its EV factory in Georgia
Rivian announced some changes today with regard to the factory its building i...
The logic of the racist Supreme Court isn’t adding up
Close watchers of the Supreme Court knew that the conservative supermajority ...
人工智能沙箱正迎来其Kubernetes时刻
Recently, Anthropic announced that its new model, Mythos, had autonomously fo...
微软的Xbox模式现已在所有Windows 11 PC上可用
Microsoft is now rolling out its Xbox mode to all Windows 11 PCs. The new Xbo...