量子位 ·

Scaling Law百度最早提出！OpenAI/Claude受它启发，致谢中有Ilya

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

Scaling Law由百度于2017年提出，研究了深度学习中训练集大小、计算规模与模型精度的关系。实证研究表明，泛化误差与训练集大小呈幂律关系，模型大小与数据大小存在缩放关系。这一发现对深度学习的研究和实践具有重要影响，助力模型调试和系统设计。

🎯

关键要点

Scaling Law由百度于2017年提出，研究训练集大小、计算规模与模型精度的关系。
实证研究表明，泛化误差与训练集大小呈幂律关系，模型大小与数据大小存在缩放关系。
研究由吴恩达主持，来自百度硅谷人工智能实验室，使用LSTM进行测试。
在机器翻译、语言建模、图像分类和语音识别等领域发现了Scaling Law的规律。
随着训练集规模增大，泛化误差以幂次下降，模型大小增长速度慢于数据大小。
研究结果对深度学习的研究、实践和系统设计具有重要影响。
研究团队的合著者们在各自机构继续从事大模型相关研究，Ilya的名字出现在致谢中。
Amodei在百度研究院工作时对Scaling Law有初步印象，发现模型性能随规模增加而提升。
这一研究成果再次引起关注，许多人回顾并重温相关知识。

🏷️

继续阅读

提高人工智能模型解释其预测能力
麻省理工学院研究人员开发了一种新方法，利用深度学习模型提取概念，以提高计算机视觉模型的准确性和可解释性。该方法通过限制使用的概念数量，确保选择最相关的概念...
OpenAI宣布收购AI安全初创公司Promptfoo 可以提高智能体的安全防御能力
OpenAI 收购了 AI 安全初创公司 Promptfoo，旨在提升 AI 智能体的安全性。Promptfoo 成立于 2024 年，估值 8600 万...
OpenAI和谷歌的员工支持Anthropic对五角大楼的诉讼
致命自主武器在新环境中表现不可靠，无法准确识别目标，缺乏人类判断能力，因此决策过程中需有人类参与以确保安全。
88岁图灵奖得主，用Claude一小时破解30年数学悬案
88岁图灵奖得主高德纳对Claude AI在1小时内解决他研究30年的三维图论问题感到震惊。Claude通过结构性思维而非暴力搜索，展现了逻辑推理和创造性...
arXiv创始人亲测：水论文这一块，Grok最强，Claude最不配合
arXiv创始人Paul Ginsparg参与研究AI生成的“水论文”，测试了13个大语言模型的造假能力。结果显示，Claude模型最为守规，而Grok和...
科研AI出了个狠角色：开源30B小模型，硬刚Gemini和Claude
UniScientist是一个开源的30B参数AI模型，能够实现科研闭环，包括提出假设、收集证据和验证。通过动态系统建模和人类专家的验证，该模型提升了科研...

Scaling Law百度最早提出！OpenAI/Claude受它启发，致谢中有Ilya

内容提要

关键要点

标签

继续阅读