宝玉的分享 ·

大语言模型（LLM）到底是怎么运作的？（配图通俗讲解）

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

条件概率是指在已知某事件发生的情况下，另一个事件发生的概率。大语言模型（LLM）通过学习单词序列的条件概率来预测下一个单词，并通过温度调节生成内容的多样性与创造性。

🎯

❓

大语言模型通过计算已知上下文中所有可能单词的条件概率，选择概率最高的单词作为预测结果。

条件概率是指在已知某事件发生的情况下，另一个事件发生的概率，通常表示为P(A|B)。

温度用于调节生成内容的多样性与创造性，低温度输出更确定的结果，高温度则输出更随机和多样化的内容。

大语言模型的训练过程是有监督的，主要是学习高维单词序列的概率分布。

直接选择概率最高的单词会导致输出内容重复和单调，缺乏创意。

大语言模型并不是简单选择得分最高的单词，而是从概率分布中随机抽样，温度值影响抽样的结果。

🏷️

The latest AI news we announced in May 2026
May AI recap
How OpenAI Built a Secure Windows Sandbox for Codex Agents
OpenAI details Codex Windows sandbox architecture, showing how SIDs, ACLs, re...
MAHA希望将棉花打造成新的牛脂
In between beef tallow fries, raw milk, and vaccine denialism, Make America H...
深入探讨语言模型的校准：Platt缩放、等距回归与温度缩放
Discover three post-hoc methods for closing the gap between confidence and accuracy.
你说我的新智能秤是‘为GLP-1用户设计的’是什么意思？
Withings推出的BodyFit智能秤专为GLP-1用户设计，旨在监测肌肉质量。GLP-1药物可能导致肌肉流失，因此需要关注蛋白质摄入和力量训练。尽管...
这家人工智能初创公司声称能够判断一个剧本是否会成为热门电影
AI初创公司Quilty声称通过剧本分析预测电影票房成功，但实际测试结果不佳，预测不准确。Quilty结合多种AI工具提供剧本分析和成功概率评分，旨在帮助...