Yi's Blog ·

三年LLM：过去和未来

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

自2022年底发布以来，OpenAI的ChatGPT迅速普及。基于Transformer架构的大语言模型（LLM）展现出强大能力，尤其在文本生成和教学中表现优异，但仍需人类引导。未来，LLM可能面临训练数据劣化的瓶颈，并与人类智能存在本质差异。

🎯

关键要点

OpenAI的ChatGPT自2022年底发布以来迅速普及。
Transformer模型于2017年由谷歌提出，核心是self-attention机制。
OpenAI于2018年发布GPT-1模型，奠定了LLM的总体架构。
LLM在文本生成和教学中表现优异，但仍需人类引导。
LLM在教学中能有效利用大量先验知识，提升学习效率。
Agent概念通过自动化提供上下文，提升LLM的智力表现。
多模态能力在文字处理上表现良好，但在数学笔记转化上存在不稳定性。
AI产品中存在泡沫，许多低质量产品充斥市场。
LLM与人类智能存在本质差异，输出与输入强相关。
LLM可能面临训练数据劣化的瓶颈，影响未来发展。
LLM的普及可能导致部分职业的神秘性消失，但并不必然引发失业潮。

❓

延伸问答

OpenAI的ChatGPT自何时开始普及？

OpenAI的ChatGPT自2022年底发布以来迅速普及。

Transformer模型的核心机制是什么？

Transformer模型的核心机制是self-attention机制。

LLM在教学中有哪些优势？

LLM在教学中能有效利用大量先验知识，提升学习效率。

LLM与人类智能有什么本质差异？

LLM与人类智能存在本质差异，主要体现在输出与输入的强相关性。

未来LLM可能面临哪些挑战？

未来LLM可能面临训练数据劣化的瓶颈，影响其发展。

LLM的普及会导致失业潮吗？

LLM的普及可能导致部分职业的神秘性消失，但并不必然引发失业潮。

🏷️

继续阅读

梦境：为更有帮助的ChatGPT提供更好的记忆
OpenAI推出了更强大的记忆系统，通过“梦境”功能自动更新用户信息，提高ChatGPT在互动中的时效性和准确性。该更新已向美国的Plus和Pro用户推出...
什么是 AI 对话开发？AI 对话开发有什么用途？(2026 完整指南)
AI对话开发结合语音识别、大语言模型和语音合成，能够与用户自然交流，广泛应用于智能客服、AI陪伴和在线教育等领域。与传统聊天机器人不同，AI对话能够理解上...
他们是由权重构成的：一篇让你重新思考AI与人类的文章
本文探讨了大语言模型的核心原理，强调知识和推理能力分布在权重网络中，而非独立模块。通过类比人类大脑，讨论了意识的涌现理论及人类对AI的情感投射，指出人类对...
真重置！Codex因昨日连续发生的多次故障重置本周额度继续向后顺延7天
OpenAI的Codex于早上8点半完成了本周的额度重置，以补偿前一天的故障，这些故障影响了ChatGPT的登录和API调用。重置仅限于付费用户，下一次重...
[折扣代码] ChatGPT商业版向8个国家用户提供买1送1优惠至少开通2个席位
OpenAI推出ChatGPT商业版促销活动，用户开通两个席位可享买一送一优惠。该服务支持八个国家，价格从18英镑到25美元不等，印度区价格最低，约134...
OpenAI合并ChatGPT和Codex，AI超级App路线浮出水面！
OpenAI合并了ChatGPT和Codex，推出了AI超级App，Codex用户已超过500万，其中20%为非开发者。新功能包括角色插件、网站和批注，旨...