OneFlow深度学习框架 ·

AI Scaling的神话

💡 原文中文，约5300字，阅读约需13分钟。

📝

内容提要

本文讨论了语言模型的扩展和发展趋势，指出扩展定律被误解，模型的涌现能力受限于外推能力，高质量训练数据难以获取，扩展几乎无法实现人工通用智能，模型行业面临模型尺寸下行压力，合成数据不能替代高质量人类数据，训练时间逐渐增长，许多CEO降低了对AGI的期望。

🎯

❓

扩展定律并不意味着模型能力会无限提升，它只是量化了模型预测能力的提高，而真正重要的是模型的涌现能力。涌现能力与模型规模的增加并不总是成正比。

获取高质量训练数据的难度增加，未来数据获取成本可能显著上升，尤其是数据版权持有者希望得到补偿时。

合成数据不能替代高质量的人类数据，虽然在特定领域有成功案例，但不适用于所有任务。

模型尺寸面临下行压力，开发者更倾向于生成较小的模型，而训练时间却在逐渐增加。

许多CEO降低了对AGI的期望，通用性被视为一个连续谱系而非二元对立的概念，反映出对实现AGI的信心减弱。

未来AI研究的重点将从扩展数据集转向提高训练数据的质量，细致的数据清理和过滤将成为关键。

🏷️

在国际人工智能竞争中成为参与者所需的条件
文章讨论了国际人工智能发展的关键因素，包括适应当地语言和文化的模型需求、全球半导体供应链的挑战，以及风险投资对国际AI公司的关注。PVP支持早期AI公司，...
六月Android更新：全新个性化和安全功能上线
谷歌最近发布了Android更新，新增假冒来电检测、Circle to Search快速查找服装、儿童安全功能的个人安全应用、Google Play图书的...
GitHub Copilot 应用：原生桌面体验
马里奥·罗德里格斯是GitHub的首席产品官，专注于开发者工具，负责GitHub的AI战略和Copilot产品线。他曾在微软和GitHub担任领导职务，并...
Visual Studio的未来动态：我们的微软Build 2026公告
微软Build大会于6月2日至3日在旧金山举行，发布了Visual Studio的新功能，重点在于将代码视为资产，增强开发工具的协作性。新功能包括构建前错...
微软推出了高通无法实现的迷你Surface开发盒
微软推出了新的Surface RTX Spark开发盒，专为本地AI开发设计，搭载Nvidia的Arm架构RTX Spark芯片，具有128GB统一内存，...
微软的新开发者优化版Windows更深入地拥抱Linux
微软在Build开发者大会上宣布，将Linux子系统进一步整合到Windows中，推出优化的Windows 11开发者体验，包括Linux容器、命令行工具...