MachineLearningMastery.com ·

大型语言模型如何选择词汇：Logits、Softmax与采样的实用指南

💡 原文英文，约2800词，阅读约需11分钟。

📝

内容提要

本文探讨了大型语言模型（LLMs）在相同提示下生成多样化和创造性输出的机制，分析了采样策略及温度、top-k、top-p等参数对输出一致性和创造性的影响。通过实例，读者将掌握如何调整LLM的输出特性。

🎯

关键要点

大型语言模型（LLMs）在相同提示下生成多样化和创造性输出的机制是其核心特征。
采样策略和参数（如温度、top-k、top-p）影响输出的一致性和创造性。
logits是模型为每个可能的下一个token分配的原始分数，通过softmax函数转换为概率。
温度（T）是影响输出的参数，T<1时输出更确定，T>1时输出更随机。
top-k采样通过限制候选token到前k个最可能的token来平衡确定性和创造性。
top-p采样根据累积概率选择token，动态调整候选token的数量，避免低概率选项导致的不连贯输出。
不同的采样策略影响LLM在解码阶段选择下一个单词的方式。

❓

延伸问答

大型语言模型如何生成多样化的输出？

大型语言模型通过从概率分布中采样下一个token来生成多样化的输出，这种随机性是其核心特征。

什么是logits，它们如何转化为概率？

Logits是模型为每个可能的下一个token分配的原始分数，通过softmax函数将其转化为概率。

温度参数如何影响模型的输出？

温度参数影响输出的确定性和随机性，T<1时输出更确定，T>1时输出更随机。

top-k采样和top-p采样有什么区别？

top-k采样限制候选token到前k个最可能的token，而top-p采样根据累积概率动态选择token，避免低概率选项。

如何调整大型语言模型的输出特性？

可以通过调整温度、top-k和top-p等参数来改变模型的输出特性，以实现不同的创造性或确定性。

使用top-k采样有什么优势？

top-k采样通过限制候选token的数量，加快推理速度并保持输出的连贯性和多样性。

🏷️

继续阅读

2026 06 05 HackerNews
特德·姜批评将人工智能拟人化，指出大型语言模型（LLM）并不具备意识或情感。加州大学伯克利分校因学生过度依赖AI，计算机科学课程的不及格率显著上升。美国政...
自主代理面临的最大挑战：数据库。
大型语言模型正在从简单的聊天机器人发展为能够推理和行动的自主代理，但数据库优化的复杂性仍是主要挑战。卡内基梅隆大学的安迪·帕夫洛指出，AI在数据库领域的影...
如何为机器学习预处理医疗影像——以胸部X光为例的指南
本文讨论了胸部X光影像数据集的预处理重要性，介绍了六个核心步骤：数据验证、缩放、归一化、关注区域引导、处理缺失数据和去噪。强调不当预处理可能导致模型性能下...
使用本地大型语言模型进行自主编程
本文讨论了如何使用本地大型语言模型（LLM）进行编程，特别是在GitHub转向基于使用量计费后。作者分享了运行本地模型的步骤、配置代理的方法以及推荐的模型...
什么是 AI 对话开发？AI 对话开发有什么用途？(2026 完整指南)
AI对话开发结合语音识别、大语言模型和语音合成，能够与用户自然交流，广泛应用于智能客服、AI陪伴和在线教育等领域。与传统聊天机器人不同，AI对话能够理解上...
在Vibe编码时代使OWASP前十名更具影响力
2025年OWASP前十名更新将重点从“过时组件”转向软件供应链安全，新增内存安全和“vibe编码”意识项，反映了开发者和网络应用安全领域对关键安全风险的共识。