量子位 ·

王兴一鸣惊人！美团首个开源大模型追平DeepSeek-V3.1

💡 原文中文，约4400字，阅读约需11分钟。

📝

内容提要

美团推出的开源大模型Longcat-Flash-Chat在多个基准测试中表现优异，超越DeepSeek-V3.1，展现出强大的编程和复杂任务处理能力，标志着美团在AI领域的重要进展。

🎯

🔎

美团的开源大模型Longcat-Flash-Chat不仅展示了其技术实力，也反映了公司从外卖平台向科技公司的战略转型。美团在AI领域的持续投入，尤其是211亿的研发预算，显示出其在未来科技竞争中的决心和雄心。

Longcat-Flash-Chat采用的零计算专家和Shortcut-connected MoE架构，显著提升了计算效率和模型性能。这种创新不仅降低了参数量，还提高了训练和推理的吞吐量，为大规模AI应用提供了更高效的解决方案。

美团的这一开源大模型引发了行业内外的广泛关注，尤其是在与Meta等科技巨头的比较中，展现出中国企业在AI领域的崛起。这种反差感可能会促使更多企业关注技术创新与应用落地，推动整个行业的发展。

❓

Longcat-Flash-Chat是一个560B的MoE模型，采用零计算专家和Shortcut-connected MoE架构，提升了计算效率和吞吐量。

美团计划在2024年投入211亿用于AI研发，显示出其在AI领域的决心和战略布局。

Longcat-Flash-Chat在编程能力上与Claude4 Sonnet相当，能够完成复杂的编程任务。

美团的AI战略布局包括提升员工工作效率、改造现有产品和自研大模型。

Longcat-Flash-Chat在多个基准测试中表现优异，超越了DeepSeek-V3.1等模型。

美团逐步从外卖公司转型为科技公司，注重AI技术的实际应用效果。

🏷️