程序师 ·

大模型永远也不做了的事情是什么？

💡 原文中文，约12300字，阅读约需30分钟。

📝

内容提要

作者发现大语言模型（LLM）无法解决需要更长推理步骤的问题，如Wordle和细胞自动机。LLM的注意力机制无法动态地重置上下文，导致目标漂移。作者建议通过改进架构和添加外部记忆来提高LLM的可靠性。然而，LLM仍然无法完全模拟人类的推理能力。

🎯

关键要点

大语言模型（LLM）在处理需要长推理步骤的问题时表现不佳，如Wordle和细胞自动机。
LLM的注意力机制无法动态重置上下文，导致目标漂移。
作者建议通过改进架构和添加外部记忆来提高LLM的可靠性。
LLM无法完全模拟人类的推理能力，尤其是在复杂任务中。
LLM在处理简单的逻辑推理和游戏时，常常无法给出正确答案。
逆转诅咒（Reversal Curse）使得LLM无法自动泛化理解人与人之间的关系。
LLM的推理能力与其训练数据密切相关，缺乏灵活性和动态调整能力。
即使在微调后，LLM仍然无法有效学习细胞自动机的规则。
作者认为，LLM的目标漂移和上下文处理能力是其主要限制因素。
未来的改进可能需要更好的提示、内存管理和计算能力，以提高LLM的推理能力。
尽管LLM在某些任务上表现出色，但在需要长时间推理的任务上仍然存在局限性。
实现通用人工智能（AGI）需要根本性改进现有模型的架构。

❓

延伸问答

大语言模型（LLM）在处理哪些类型的问题时表现不佳？

LLM在处理需要长推理步骤的问题时表现不佳，例如Wordle和细胞自动机。

为什么LLM无法动态重置上下文？

LLM的注意力机制是静态的，无法选择性地动态重置上下文，导致目标漂移。

作者对改进LLM的建议是什么？

作者建议通过改进架构和添加外部记忆来提高LLM的可靠性。

逆转诅咒（Reversal Curse）是什么？

逆转诅咒是指LLM无法自动泛化理解人与人之间的关系，例如从“A是B”推导出“B是A”。

LLM在复杂任务中与人类推理能力相比如何？

LLM无法完全模拟人类的推理能力，尤其是在复杂任务中表现不佳。

未来改进LLM的方向是什么？

未来的改进可能需要更好的提示、内存管理和计算能力，以提高LLM的推理能力。

🏷️

继续阅读

什么是 AI 对话开发？AI 对话开发有什么用途？(2026 完整指南)
AI对话开发结合语音识别、大语言模型和语音合成，能够与用户自然交流，广泛应用于智能客服、AI陪伴和在线教育等领域。与传统聊天机器人不同，AI对话能够理解上...
他们是由权重构成的：一篇让你重新思考AI与人类的文章
本文探讨了大语言模型的核心原理，强调知识和推理能力分布在权重网络中，而非独立模块。通过类比人类大脑，讨论了意识的涌现理论及人类对AI的情感投射，指出人类对...
人工智能没有意识：华裔科幻作家拆穿AI人格化背后认知陷阱
特德·姜批评AI人格化，认为大语言模型如Claude仅是文字续写机器，并无意识。他指出，将AI视为有感情的存在会模糊责任归属，导致人类逃避道德责任。真正的...
原华为盘古大模型负责人王云鹤离职创业；苹果硬件负责人启动重大重组；OpenAI联合创始人加入Anthropic
近期多家科技公司高管频繁变动。华为盘古大模型负责人王云鹤离职创业，成立新公司“基元律动”；阿里副总裁张凯夫也离职创业，专注市场行为预测；苹果硬件部门进行重...
LeCun 10亿押注的方向，全球领先视觉大模型团队早已布局
视启未来团队专注于开发隐空间世界模型，推动AI从“看见”向“预见”转变。创始人张磊指出，理解因果关系和物理规律至关重要。团队通过提升物体理解能力，推出全球...
2026 06 05 HackerNews
特德·姜批评将人工智能拟人化，指出大型语言模型（LLM）并不具备意识或情感。加州大学伯克利分校因学生过度依赖AI，计算机科学课程的不及格率显著上升。美国政...