2025年末对人工智能的思考

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

文章讨论了大型语言模型（LLMs）的进展，强调链式思维（CoT）在提升输出质量中的关键作用。尽管早期有人认为LLMs是随机的机器，但现在普遍认为它们可以通过强化学习和内部搜索进行改进。程序员对AI辅助编程的接受度提高，LLMs的实用性逐渐被认可。未来AGI的实现可能依赖多种架构，而ARC测试的挑战性也在降低。

🎯

关键要点

尽管早期有人认为大型语言模型（LLMs）是随机的机器，但现在普遍认为它们可以通过强化学习和内部搜索进行改进。
链式思维（CoT）被认为是提升LLM输出质量的关键，主要通过模型表示的采样和强化学习的结合来实现。
强化学习与可验证奖励的结合使得LLMs的扩展不再仅限于令牌数量，未来可能会有更多进展。
程序员对AI辅助编程的接受度显著提高，尽管LLMs仍有错误，但其提供的代码和提示的实用性已被广泛认可。
一些知名AI科学家认为，类似于Transformer的进展可能会再次发生，并开始探索替代模型和显式符号表示的世界模型。
有人认为链式思维改变了LLMs的本质，但实际上它们仍然是相同的架构，CoT的生成过程依然是逐个令牌进行的。
ARC测试的挑战性降低，小型模型在ARC-AGI-1上表现良好，而大型LLMs在ARC-AGI-2上取得了令人印象深刻的结果。
未来20年AI面临的根本挑战是避免灭绝。

❓

延伸问答

链式思维（CoT）如何提升大型语言模型的输出质量？

链式思维通过模型表示的采样和强化学习的结合，帮助模型更好地理解和生成与提示相关的内容，从而提升输出质量。

程序员对AI辅助编程的接受度如何变化？

程序员对AI辅助编程的接受度显著提高，尽管LLMs仍有错误，但其提供的代码和提示的实用性已被广泛认可。

未来实现通用人工智能（AGI）可能依赖哪些架构？

未来实现AGI可能依赖多种架构，包括不同路径的模型和显式符号表示的世界模型。

ARC测试的挑战性如何变化？

ARC测试的挑战性降低，小型模型在ARC-AGI-1上表现良好，而大型LLMs在ARC-AGI-2上取得了令人印象深刻的结果。

强化学习如何影响大型语言模型的扩展？

强化学习与可验证奖励的结合使得LLMs的扩展不再仅限于令牌数量，未来可能会有更多进展。

大型语言模型（LLMs）是否真的如早期所说是随机的机器？

早期有人认为LLMs是随机的机器，但现在普遍认为它们可以通过强化学习和内部搜索进行改进。

🏷️

继续阅读

献给计算机严谨细致的颂歌
文章探讨了计算机编程中的精确性与用户思维的关系。编程要求明确数据类型，促使开发者深思。然而，随着大型语言模型（LLMs）的出现，精确性减弱，用户可以更快实...
Frontier Tuning：教AI像您一样工作
微软在Build大会上推出了Frontier Tuning，这是一种通过强化学习使AI适应企业数据和流程的新方法。该系统在合规边界内运行，能够根据企业的独...
2026.06.02 16:44
网络流行文化通过缩短句子产生了“梗”，而大型语言模型则通过连词和副词的堆叠构建逻辑和情感。这种缩短与扩展的过程导致了准确性、意义和美感的缺失。
运营一个以人工智能为核心的工程组织
工程团队在使用Claude Code后，工作流程显著变化，传统规划被即时规划取代，强调原型和用户反馈。信息收集时优先询问Claude，代码审查中Claud...
特朗普签署行政命令，要求在发布前审查人工智能模型
特朗普签署行政命令，要求AI公司在发布前自愿向政府分享其模型，以促进安全创新并增强网络安全。该命令强调AI行业的成功与创新不应受到过度监管，同时承认新技术...
微软首款高级推理人工智能问世
微软在2026年Build大会上发布了多款新AI模型，旗舰模型MAI-Thinking-1是其自主开发的重要进展，表现优异，基于干净数据训练。此外，还推出...