量子位 ·

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

DeepSeek团队由清北应届生组成，专注于AI大模型研究，创新包括MLA注意力机制和GRPO算法，显著提升模型性能与训练效率。团队年轻化，重视能力，吸引了众多优秀人才。

🎯

🔎

DeepSeek团队的年轻化特点使其在创新和灵活性上具备优势。年轻成员通常对新技术更为敏感，能够快速适应变化，推动团队在AI大模型领域的快速发展。这样的结构也有助于吸引更多优秀人才，形成良性循环。

DeepSeek在模型算法与硬件工程的结合上表现突出，强调软硬件协同设计。这种策略不仅降低了训练成本，还提升了模型性能，显示出在AI领域中，技术与基础设施的紧密结合是成功的关键因素。

DeepSeek的用人标准强调能力而非经验，这与许多顶尖科技公司如OpenAI相似。这种策略不仅能激发年轻人的创造力，还能为团队注入新鲜血液，推动技术创新，值得其他企业借鉴。

❓

DeepSeek团队主要由清华和北大的应届生及在读生组成。

DeepSeek-v3大模型以1/11的算力训练出超过Llama 3 405B的开源模型，显著提升了训练效率。

DeepSeek团队的关键技术创新包括MLA新型注意力机制和GRPO算法。

DeepSeek的用人标准重视能力而非经验，主要招募应届生和毕业一两年的人。

DeepSeek团队运作结构灵活，鼓励自然分工和资源调配，允许成员随时调用训练集群。

DeepSeek与OpenAI相似之处在于都重视能力而非经验，并且鼓励年轻人参与项目。

🏷️