机器之心 ·

传统预训练正走向终结，推理优化与后训练提升有限，大模型今后如何突破发展瓶颈？

💡 原文中文，约4600字，阅读约需11分钟。

📝

内容提要

当前大模型面临数据稀缺问题，传统预训练模式难以持续。OpenAI创始人指出预训练将结束，研究将转向推理优化与后训练微调。新框架SICOG通过合成数据和自我进化机制提升模型能力，打破数据依赖，实现动态学习与持续优化，为未来人工智能发展提供新路径。

🎯

关键要点

当前大模型面临数据稀缺问题，传统预训练模式难以持续。
OpenAI创始人指出预训练将结束，研究将转向推理优化与后训练微调。
合成数据可能是打破当前能力天花板的关键。
新框架SICOG通过合成数据和自我进化机制提升模型能力。
SICOG实现了后训练增强、推理优化和再预训练强化的三位一体自进化机制。
描述链（CoD）和结构化思维链（Structured CoT）提升模型的感知与推理能力。
SICOG显著降低对高质量数据的依赖，实现动态认知进化。
实验结果表明SICOG在多个评测集上提升了模型的综合表现。
SICOG的自我进化机制具备高度可扩展性，推动模型持续进化。
未来研究将进一步引入环境反馈机制，实现模型的终身学习能力。

❓

延伸问答

大模型面临哪些主要挑战？

大模型面临数据稀缺问题，传统预训练模式难以持续。

OpenAI创始人对预训练的看法是什么？

OpenAI创始人指出预训练将结束，研究将转向推理优化与后训练微调。

SICOG框架的核心创新是什么？

SICOG框架通过合成数据和自我进化机制提升模型能力，实现动态学习与持续优化。

描述链（CoD）如何提升模型能力？

描述链通过分步观察图像，构建完整的逻辑严密的图像理解过程，提升模型的感知能力。

SICOG如何实现模型的动态认知进化？

SICOG通过自生成数据闭环和语义一致性筛选机制，使模型在零人工标注条件下实现认知能力的持续进化。

未来大模型的研究方向是什么？

未来研究将进一步引入环境反馈机制，实现模型的终身学习能力。

🏷️

继续阅读

用苹果 M5 Max 跑大模型真的省钱吗？有人算了一笔账
使用14寸MacBook Pro M5 Max（64GB内存）本地运行大模型的成本高于在线API。经过电费和硬件折旧计算，3年使用的总成本约为每小时$0....
智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速
智象未来在北京发布了图像大模型HiDream-O1-Image-Pro，该模型基于原生全模态架构，参数超过200亿，刷新多项基准测试纪录。公司完成新一轮融...
大型语言模型在一个无障碍性差的网站上进行训练——AudioEye数据表明，人工智能仍在构建一个无障碍性差的网站
开发者在使用大型语言模型（LLM）工具时，常忽视无障碍设计，导致网站可访问性问题严重。报告显示，95.9%的主页存在可访问性失败，许多企业因未满足无障碍标...
改名和迁移也是谷歌传统：Gemini CLI将在6月18日停止运营开发者需迁移到反重力CLI
谷歌宣布Gemini CLI将于2026年6月18日停止运营，开发者需迁移至反重力CLI。反重力CLI尚无法完全替代Gemini CLI的功能，导致部分开...
通信运营商正不断演进其云基础设施战略，以满足AI发展的需求
Omdia调研显示，通信运营商正在加速将AI/ML能力整合进云基础设施，以满足AI工作负载的需求。70%的运营商认为AI/ML支持是云决策的关键。为应对高...
.NET 10 桌面 UI 框架的范式演进：Jalium.UI 与 MewUI 架构深度对比 - 张善友
Jalium.UI 与 MewUI 代表了现代.NET 10 桌面应用开发的两个极端，两者之间不存在绝对的优劣之分，而是针对完全不同的业务领域和部署约束给出的极致答案。