机器之心 ·

GPT-5涌现能力可预测？UC伯克利仅使用当前模型检查点预测未来模型

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

LLM扩展面临的挑战在于对涌现能力的理解不足。UC伯克利的研究表明，通过微调模型可以预测涌现能力，并发现微调可以提前识别涌现点。研究使用四个NLP基准验证了涌现定律，结果显示微调数据量影响涌现偏移，能够准确预测涌现点。

🎯

关键要点

LLM扩展面临的挑战是缺乏对涌现能力的理解。
UC伯克利的研究提出了通过微调模型预测涌现能力的任务。
研究使用四个NLP基准验证了涌现定律，结果显示微调数据量影响涌现偏移。
微调可以提前识别涌现点，移动临界点至能力较低的模型。
微调后的模型在预训练损失下表现一致，预训练损失是有效的独立变量。
涌现偏移受微调数据量影响，微调数据量可以调节涌现偏移。
研究结果表明，涌现定律可以提前准确预测涌现点，最多可提前4倍FLOP。
在不同任务上，提前预测涌现的程度有所不同，MMLU和GSM8K上可提前最多4.3倍和3.9倍FLOPS。
作者进行了真实世界的案例研究，评估预训练数据质量和预测更复杂的能力。

❓

延伸问答

UC伯克利的研究如何预测涌现能力？

UC伯克利的研究通过微调模型，使用当前模型的检查点来预测未来模型的涌现能力。

微调数据量对涌现能力有什么影响？

微调数据量会影响涌现偏移，调节涌现能力出现的临界点。

研究中使用了哪些NLP基准进行验证？

研究使用了MMLU、GSM8K、CommonsenseQA和CoLA四个NLP基准进行验证。

涌现定律的主要发现是什么？

涌现定律表明可以提前准确预测涌现点，最多可提前4倍FLOP。

研究中提到的涌现案例研究有哪些？

研究中提到的案例研究包括低成本评估预训练数据质量和使用困难APPS编码基准预测复杂能力。

微调如何影响模型的性能？

微调可以将涌现发生的临界点向能力较低的模型移动，从而提前识别涌现点。

🏷️

继续阅读

开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex
OpenAI的GPT-5.5和GPT-5.4模型以及Codex已在Amazon Bedrock平台上线。这些模型专注于代码编写和复杂工作流程，支持开发者通...
[MAF预定义ChatClient中间件-03]CachingChatClient——利用缓存省钱省时间 - Artech
CachingChatClient是一个中间件，用于缓存LLM调用结果，减少重复调用的时间和费用。它通过检查缓存返回相同输入的响应，若不存在则调用LLM并...
智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
首尔的目标：NVIDIA与韩国如何共同构建AI的未来
NVIDIA创始人兼首席执行官黄仁勋访问韩国，强调AI供应链的重要性，并指出韩国在机器人和物理AI领域的潜力。他认为韩国是AI和游戏的中心，未来将有更多投资机会。
基于220种海洋细菌，科学家用基因组尺度模型重构异养微生物分类体系，挖出8类代谢菌群
研究揭示海洋异养微生物的代谢生态位，打破传统的富营养型与寡营养型二分法，提出8类代谢菌群。通过基因组分析，阐明其生长规律与资源竞争，推动全球碳循环研究，为...
微软MAI模型发布深度解读：前沿微调成企业AI护城河
微软在2026年推出的MAI系列模型标志着其从依赖OpenAI转向自建AI模型的战略转变。MAI模型涵盖推理、编码、图像和语音等多个领域，特别是通过“前沿...