小红花·文摘

2024年，混合专家（MoE）架构成为大模型的主流，开源项目如Mixtral和DeepSeek推动了其发展。MoE通过减少激活参数显著降低计算成本，同时提升模型表达能力，适合算力充裕的场景。关键技术包括细粒度专家、共享专家和改进的负载均衡策略。未来，MoE将向更大规模和动态专家数发展。

土法炼钢兴趣小组的博客 ·

量子位 ·

实时互动网 ·

Voyage AI ·

上一篇文章《MoE环游记：6、最优分配促均衡》中，我们通过求解如下最优分配问题来实现负载均衡\begin{equation}\max_{x_{i,j}\in\{0,1\}} \sum_{i,j}...

科学空间|Scientific Spaces ·

我们知道，负载均衡（Load Balance）是MoE架构中基本且关键的一环，直接影响模型的效率和性能。本系列已经有两篇文章介绍了两种实现负载均衡的主流思路，分别是《MoE环游记：2、不患寡而患...

科学空间|Scientific Spaces ·

机器之心 ·

美团技术团队 ·

Apple Machine Learning Research ·

机器之心 ·

机器之心 ·

OpenAI开源的新模型采用Circuit Sparsity技术，使99.9%的权重为零，提升了模型的可解释性。通过严格的连接约束，简化了计算过程，解决了传统模型的黑箱问题。尽管计算成本较高，但未来有望实现更复杂的推理。

量子位 ·

Apple Machine Learning Research ·

机器之心 ·

机器之心 ·

机器之心 ·

英特尔在2025技术大会上推出酷睿Ultra 9 200H系列处理器，支持最高128GB内存和120B MoE模型，提升本地AI体验，适用于多种设备，满足专业与日常需求，确保数据隐私，推动智能化进程。

量子位 ·

实时互动网 ·

Cursor发布了首个编程大模型Composer，速度达每秒250个tokens，效率提升400%。Cursor 2.0新版本引入原生浏览器工具和语音生成代码功能，支持多Agent协作。Composer通过强化学习训练，能在真实环境中执行编程任务，但模型来源尚不明确。

量子位 ·

HyperAI超神经 ·