机器之心 ·

连OpenAI都推不动Scaling Law了？MIT把「测试时训练」系统研究了一遍，发现还有路

💡 原文中文，约4700字，阅读约需11分钟。

📝

内容提要

OpenAI的下一代模型质量提升受到高质量数据减少的限制，Scaling Law可能不再适用。研究者提出了测试时训练（TTT）方法，显著提升了模型在抽象推理任务中的表现，挑战了传统依赖符号逻辑的假设。

🎯

❓

OpenAI下一代模型质量提升受限于高质量数据减少，Scaling Law可能不再适用。

测试时训练（TTT）方法是在测试阶段通过显式的梯度步骤更新模型，以提升性能，尤其适用于数据量极低的环境。

TTT方法显著提高了模型在抽象与推理语料库（ARC）上的性能，普通语言模型在ARC任务上可达到或超过许多神经-符号方法的性能。

MIT研究者系统研究了TTT设计选择的影响，发现其在few-shot学习中的有效应用，并评估了TTT在ARC中的表现。

TTT方法与现有方法结合可提高准确率，展示了程序合成与全神经网络方法的互补性。

TTT方法的设计空间广泛，目前对其有效性和最佳实践的了解有限，研究者正在探索不同设计选择的影响。

🏷️

eBay拒绝游戏驿站560亿美元收购提案；OpenAI收购Tomoro并成立新实体；腾讯音乐完成收购喜马拉雅
OpenAI收购咨询公司Tomoro，成立新合资企业以推动人工智能应用。优步提高对Delivery Hero的收购报价。阳狮集团以22亿美元收购LiveR...
开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex
OpenAI的GPT-5.5和GPT-5.4模型以及Codex已在Amazon Bedrock平台上线。这些模型专注于代码编写和复杂工作流程，支持开发者通...
How OpenAI Built a Secure Windows Sandbox for Codex Agents
OpenAI details Codex Windows sandbox architecture, showing how SIDs, ACLs, re...
姚顺雨首度公开回应：为什么离开OpenAI加入腾讯？
2026腾讯云AI产业大会在北京举行，姚顺雨首次公开露面，分享了他对AI下半场的看法。他强调AI的核心在于寻找问题，而非技术本身，并指出腾讯的产品环境和组...
全球首个机器人训练楼盘开盘：30万套中国住宅，机器人拎包入住
大晓机器人与港中文MMLab推出Kairos-Homeworld，这是首个全屋三维生成与物体级交互框架，利用30万套中国住宅户型数据为机器人提供训练环境。...
MiniCPM5-1B采用RL+OPD训练，多项复杂任务达SOTA；面向复杂医疗业务自动化：医疗智能体评测数据集 CHI-Bench
TACK 是 AI Laboratory for Molecular Engineering 于 2026 年发布的一个标准化知识库数据集与基准测试集，旨...