量子位 ·

全球首个英伟达含量为0的万亿模型，成了海外开发者的抢手货

💡 原文中文，约4600字，阅读约需11分钟。

📝

内容提要

美团推出的LongCat-2.0模型采用自研MoE架构，参数达到1.6万亿，首次在国产算力上实现全链路训练与推理。该模型在代码、工具调用和逻辑推理等任务中表现优异，优化了注意力计算和嵌入层，显著提升了性能并降低了成本，展示了国产算力支持大模型的能力。

🎯

🔎

LongCat-2.0的成功标志着国产算力在AI领域的重大进步。它首次在国产芯片上实现了万亿参数模型的全链路训练与推理，证明了国产技术的可行性。这一突破不仅提升了国内AI技术的自信心，也为未来更多大模型的研发奠定了基础。

LongCat-2.0在训练和推理成本上相较于英伟达路线具有明显优势，这使得其在市场上受到开发者的青睐。随着越来越多的开发者选择使用这一模型，未来可能会推动更多国产AI产品的普及与应用，形成良性循环。

LongCat-2.0在架构设计上进行了多项创新，如LongCat稀疏注意力和N-gram嵌入，这些技术提升了模型的计算效率和准确率。随着AI应用场景的不断扩展，这些技术创新将为各行业带来更高效的解决方案，值得关注其后续发展。

❓

LongCat-2.0模型的参数数量达到1.6万亿。

LongCat-2.0模型采用自研的MoE混合专家架构。

LongCat-2.0在国产算力上实现了全链路训练与推理，性能优异且成本较低。

LongCat-2.0通过LongCat稀疏注意力（LSA）优化了注意力计算，提升了处理速度。

LongCat-2.0首次证明了国产算力具备支撑大模型持续训练和部署的能力。

LongCat-2.0的训练和推理成本比同等规模的英伟达路线低，具有更高的成本优势。

🏷️