大语言模型(LLM)到底是怎么运作的?(配图通俗讲解) * LLM本质上是学习单词序列的条件概率。 * 每次预测下一个单词时,会根据已出现的上下文计算条件概率。 * 使用温度(Temperature)是为了控制生成结果的多样性和创造性。 条件概率是指在已知某事件发生的情况下,另一个事件发生的概率。大语言模型(LLM)通过学习单词序列的条件概率来预测下一个单词,并通过温度调节生成内容的多样性与创造性。 llm 单词序列 大语言模型 条件概率 温度调节 预测