BriefGPT - AI 论文速递 ·

ProMoE：基于先进缓存的快速MoE大语言模型服务

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

该研究提出了QMoE框架，将1.6万亿参数的SwitchTransformer模型压缩至160GB，压缩比达到20倍，且在单个GPU上执行时间不足一天，运行时开销低于5%。

🎯

🏷️

WhatsApp测试‘Plus’订阅服务，每月几美元即可添加贴纸等功能
WhatsApp推出“WhatsApp Plus”订阅服务，初期仅限部分Android用户，iOS支持将稍后推出。用户可享受独特的贴纸、主题、图标和铃声等...
DXC宣布咨询与工程服务业务部门高管任命
DXC Technology宣布对咨询与工程服务部门进行高管任命与组织调整，以增强业务能力，支持企业实现AI愿景。Dan Albright负责Adviso...
Mythos架构被22岁小伙“逆推”开源了！MoE和注意力借鉴DeepSeek
OpenMythos是一种新型的循环深度Transformer架构，采用MoE路由机制，通过跨专家权重共享实现高效推理。在参数量减少近一半的情况下，其性能...
聊聊为什么我要花这么大精力，带大家手写 Agent Harness？
本文永久链接 – https://tonybai.com/2026/04/21/why-we-are-building-agent-harness-fro...
The Lenovo Legion Go S is RAMageddon’s latest victim
You can still find the Asus Xbox Ally X and the MSI Claw 8 AI Plus for $999 a...
我们正在将Gemini功能扩展到亚太地区的用户。
Google is rolling out many of Chrome's latest AI features in Australia, I...