美团技术团队 ·

美团发布基于 N-gram 全新模型：嵌入扩展新范式，实现轻量化 MoE 高效进化

💡 原文中文，约3800字，阅读约需9分钟。

📝

内容提要

美团 LongCat 团队推出了 LongCat-Flash-Lite，这是一款轻量化的 MoE 模型，参数量为685亿，推理时激活29亿至45亿参数。该模型在智能体和编程任务中表现优异，尤其在复杂工具使用和代码修复方面，现已开源，欢迎开发者体验。

🎯

关键要点

美团 LongCat 团队推出 LongCat-Flash-Lite，参数量为685亿，推理时激活29亿至45亿参数。
LongCat-Flash-Lite 在智能体和编程任务中表现优异，尤其在复杂工具使用和代码修复方面。
传统 MoE 架构面临边际收益递减和系统通信开销上升的问题，LongCat 团队通过嵌入扩展获得更优效能。
N-gram嵌入层增强模型对局部上下文语义的捕获能力，提升语义理解的精准度。
LongCat-Flash-Lite 通过动态激活机制和三重优化实现推理效率的提升。
模型在智能体工具使用与编程任务上均展现出领先性能，尤其在代码修复和终端命令执行方面。
LongCat-Flash-Lite 在综合知识和推理能力评估中保持与规模相匹配的均衡性能。
LongCat-Flash-Lite 开源，欢迎开发者体验和研究，提供每日5000万tokens的免费额度。

🏷️

继续阅读

基于NativeAOT的 OpenClaw.NET 深度刨析 - 张善友
OpenClaw.NET是一个基于C#和NativeAOT技术的自主智能体框架，解决了JavaScript架构的内存膨胀和冷启动延迟问题。通过深度抽象和插...
2026年KubeCon + CloudNativeCon欧洲联合活动深入探讨：OpenTofu日
2024年KubeCon欧洲首次亮相的OpenTofu Day，旨在为DevOps工程师和基础设施领导者提供交流平台，聚焦OpenTofu的实际应用、迁移...
卡帕西开源Agent自进化训练框架，5分钟一轮实验，48h内揽星9.5k
卡帕西推出开源项目autoresearch，旨在让AI自主进行科研。该框架仅630行代码，支持单GPU运行，每5分钟进行一次实验，AI根据结果自我调整。未...
科研AI出了个狠角色：开源30B小模型，硬刚Gemini和Claude
UniScientist是一个开源的30B参数AI模型，能够实现科研闭环，包括提出假设、收集证据和验证。通过动态系统建模和人类专家的验证，该模型提升了科研...
AI 不只是聊天：小龙虾背后的范式变化
小龙虾（OpenClaw）展示了三种AI应用方式：聊天AI、自动化工具和AI代理。聊天AI用于回答问题，自动化工具处理流程，而小龙虾能够自主规划任务。尽管...
派早报：达摩院发布脂肪肝筛查 AI 模型 MAOSS 等
阿里巴巴达摩院与多家医院合作研发的脂肪肝筛查AI模型MAOSS，能够通过CT影像和血清指标精准筛查肝脂肪分期，将高风险患者的检出率提升至52.4%。该研究...

美团发布基于 N-gram 全新模型：嵌入扩展新范式，实现轻量化 MoE 高效进化

内容提要

关键要点

标签

继续阅读