SharpCJ ·

拆穿名词诈骗！用大白话理解晦涩难懂的AI概念 - SharpCJ

💡 原文中文，约8000字，阅读约需19分钟。

📝

内容提要

本文探讨了AI领域的基本术语与概念，重点介绍了大语言模型（LLM）、Token、上下文（Context）和记忆（Memory）。大模型通过数学运算处理文本，Token是最小单元，而Context是模型的临时记忆。文章还讨论了如何通过提示词（Prompt）与模型互动，以及Agent的自主决策能力，并展望了AI技术的未来发展。

🎯

关键要点

AI领域充满新名词，许多术语实际上解决的是基本工程问题。
大语言模型（LLM）是基于Transformer架构的，GPT-3.5和GPT-4是其重要里程碑。
大模型通过数学运算处理文本，实际上是进行文字接龙游戏。
Token是大模型处理文本的最小单元，通过Tokenizer进行编码和解码。
上下文（Context）是大模型的临时记忆，Context Window定义了其容量限制。
Memory使得AI具备跨会话、跨任务的能力，提升了智能体的功能。
Prompt是用户与大模型互动的指令，良好的Prompt能提高输出质量。
RAG（检索增强生成）解决了大模型知识过时的问题，通过外部数据库补充信息。
Tool是大模型与外部世界交互的接口，赋予其执行动作的能力。
MCP（模型上下文协议）统一了工具接入标准，简化了开发过程。
Agent是具备自主决策能力的智能体，能够理解目标并执行任务。
Workflow是基于工作流的智能体，用户需明确每一步，而Agent则是自主决策。
Agent Skill是将复杂流程打包成独立技能包，提高了准确性和效率。
大模型技术的演进逻辑是从单一到复合，从通用到专用，未来将进一步融合。

❓

延伸问答

什么是大语言模型（LLM）？

大语言模型（LLM）是基于Transformer架构的模型，能够通过数学运算处理文本，进行文字接龙游戏。

Token在大模型中有什么作用？

Token是大模型处理文本的最小单元，通过Tokenizer进行编码和解码，决定了计算成本和模型的处理能力。

上下文（Context）和记忆（Memory）在AI中有什么区别？

上下文是大模型的临时记忆，包含当前对话的信息；而记忆则使AI具备跨会话、跨任务的能力，能够保存和组织信息。

如何通过提示词（Prompt）与大模型互动？

提示词是用户给大模型的具体指令，良好的Prompt能提高输出质量，直接影响模型的理解和响应。

RAG（检索增强生成）是如何解决大模型知识过时的问题的？

RAG通过从外部数据库检索相关信息，补充大模型的知识，使其在回答问题时更加准确和及时。

Agent在AI中扮演什么角色？

Agent是具备自主决策能力的智能体，能够理解目标并执行任务，标志着AI从内容生成转向任务解决。

🏷️

继续阅读

一位观察者的画像：读科尔姆·托宾的《大师》
《三体》讲述了地球与外星三体文明之间的星际战争。三体人因生存环境恶劣，决定侵略地球。小说探讨了外星人为何不主动寻找移民星球，并引入了智子这一设定，以封锁地球的科技发展。
HBO的《哈利·波特》系列没有伦理消费
英国最高法院的裁决存在问题，因为人类性别并非二元。这一决定不仅阻碍了跨性别者合法确认性别身份，还使他们在性别歧视案件中的追诉变得更加困难。罗琳庆祝这一裁决...
m3u8 下载器 v26.03.28
使用命令行工具python m3u8_downloader.py下载视频，输入视频链接和输出文件名，指定保存路径为D:\Videos。
北宫新绿
周末带孩子爬山时突遇大雨，气温骤降，提醒今后爬山要穿厚衣服以防失温。
Learn about Git Worktree
Git worktree命令用于管理工作树，功能包括添加、列出、锁定、移动、修剪、移除和修复工作树。
WebAssembly在边缘环境中已优于容器
WebAssembly（Wasm）在边缘和无服务器环境中优于容器，关键在于组件模型标准化。Wasm的成熟体现在服务器和后端服务的可靠使用上。最新的Prev...