量子位 ·

非Transformer架构新模型爆火，从第一性原理出发，MIT CSAIL衍生团队打造

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

MIT团队推出的液态神经网络LFM模型因其高效内存管理和优越性能受到关注。LFM在处理长上下文时表现出色，内存占用远低于Transformer模型，适用于多种模态和平台。尽管在多种基准测试中表现优异，支持多语言，但在零样本代码任务上仍有不足。Liquid AI团队由MIT CSAIL衍生，专注于构建高效AI系统。

🎯

关键要点

MIT团队推出的LFM模型因高效内存管理和优越性能受到关注。
LFM在处理长上下文时表现出色，内存占用远低于Transformer模型。
LFM架构具有良好的可扩展性，支持多种模态和平台。
LFM模型在多种基准测试中表现优异，但在零样本代码任务上仍有不足。
Liquid AI团队专注于构建高效AI系统，源自MIT CSAIL。
LFM 1.3B和LFM 3B模型性能超越同等规模的Transformer模型。
LFM 40B模型可与更大规模的密集模型或MoE模型相媲美。
LFM在处理100万个token时内存占用仅需16 GB，远低于Llama-3.2的48 GB。
LFM模型支持多种语言，包括英语、西班牙语、法语、德语等。
Liquid AI团队将持续发布LFM架构的技术细节和更新。

❓

延伸问答

LFM模型的主要优势是什么？

LFM模型在内存管理方面表现优越，处理长上下文时内存占用远低于Transformer模型。

LFM模型支持哪些语言？

LFM模型支持英语、西班牙语、法语、德语、中文、阿拉伯语、日语和韩语等多种语言。

LFM模型在零样本代码任务上表现如何？

LFM模型在零样本代码任务上表现不足，尚未达到理想效果。

Liquid AI团队的背景是什么？

Liquid AI团队源自MIT计算科学与人工智能实验室，专注于构建高效的AI系统。

LFM模型的内存占用与其他模型相比如何？

LFM 3B模型处理100万个token时只需16 GB内存，而Llama-3.2则需48 GB以上。

LFM模型的架构特点是什么？

LFM模型基于液态神经网络，采用动态系统理论和信号处理，具有良好的可扩展性。

🏷️

继续阅读

将您的架构待办事项与技术路线图优先级（TRP）对齐
成功的数字化转型需要业务和技术利益相关者在编写代码前达成共识。70%的转型失败源于利益相关者不一致。使用技术路线图优先级（TRP）框架，组织可以快速确定优...
介绍Gemma 4 12B：一个统一的无编码多模态模型
Gemma 4 12B是最新的多模态智能模型，专为笔记本电脑设计，具备强大的推理能力和音频输入。它采用无编码架构，减少延迟和内存使用，支持在16GB内存的...
编码不再是瓶颈：在Spotify扩展开发者体验至团队和代理
Spotify通过内部开发平台和最佳工程实践，加速了AI工具的应用，99%以上的工程师每周使用AI编码工具，显著提升了生产力。引入Honk背景编码代理，自...
浏览器指纹与反爬虫：TLS JA3、HTTP/2指纹原理及绕过方法
本文讨论了数据抓取中的反爬虫技术，重点介绍了浏览器指纹，包括TLS指纹和HTTP/2指纹。通过分析请求头、TLS握手和HTTP/2设置，服务器能够识别客户...
Free CPU教程丨西湖大学张岳团队开源科研插图神器AutoFigure，可精准理解长篇科学文本
西湖大学的张岳团队推出了智能科研插图生成系统AutoFigure，旨在解决高质量科研插图的生成难题。该系统基于长篇科学文本，确保插图的逻辑结构准确且视觉美...
[显示BUG没重置] Codex已重置本周使用限额原因似乎与部分模型出现的故障有关
本周，OpenAI的Codex、ChatGPT和API出现故障，导致用户使用受限。Codex团队已重置所有付费用户的使用限额，并延长7天。故障原因与部分模...