dotNET跨平台 ·

LLM探索：GPT类模型的几个常用参数 Top-k, Top-p, Temperature

💡 原文中文，约3000字，阅读约需7分钟。

📝

内容提要

本文介绍了使用ChatGPT接口或本地部署LLM大模型时常用的三个参数：temperature、top_k和top_p，它们可以影响模型输出的随机性和候选词选择。同时提供了调参建议和注意事项。

🎯

关键要点

文章介绍了使用ChatGPT接口或本地部署LLM大模型时常用的三个参数：temperature、top_k和top_p。
这三个参数影响模型输出的随机性和候选词选择。
temperature参数控制模型输出结果的随机性，值越大随机性越大，值为0时输出固定。
较低的temperature值使输出更集中和确定，较高的值则使输出更随机和有创意。
top_k和top_p是采样参数，提供不同的候选词选择方式。
top_k从生成的token中选择前k个作为候选，设置越大生成内容可能性越大。
top_p（核采样）根据概率阈值动态选择候选词，通常设置为较高值以限制低概率token的采样。
top_k和top_p可以一起使用，top-p在top-k之后起作用。
调参建议：根据prompt的长度和清晰度调整temperature、top_k和top_p的值。

🏷️

继续阅读

[显示BUG没重置] Codex已重置本周使用限额原因似乎与部分模型出现的故障有关
本周，OpenAI的Codex、ChatGPT和API出现故障，导致用户使用受限。Codex团队已重置所有付费用户的使用限额，并延长7天。故障原因与部分模...
一夜之间，ChatGPT 变成了第二个 Claude
OpenAI计划将Codex整合进ChatGPT，以提升其在企业工作中的应用。Codex将支持数据分析、市场营销等多种任务，用户可通过统一界面操作。目前C...
黄仁勋称美满电子将成为下一个万亿美元公司；SK海力士计划五年内将内存产能翻番；ChatGPT全球月活跃用户数突破10亿
黄仁勋表示，美满电子将成为下一个万亿美元公司。英伟达推出新PC处理器，SK海力士计划在五年内翻倍内存产能。ChatGPT月活跃用户数突破10亿，Space...
介绍Gemma 4 12B：一个统一的无编码多模态模型
Gemma 4 12B是最新的多模态智能模型，专为笔记本电脑设计，具备强大的推理能力和音频输入。它采用无编码架构，减少延迟和内存使用，支持在16GB内存的...
为GPT-Rosalind引入新功能
GPT-Rosalind系列模型更新，专为生命科学研究设计，提升了药物发现智能和工具使用能力。该模型在生物学、药物化学和基因组学等领域表现出显著提升，通过...
语音增强中的自监督学习：从无配对训练到基础模型先验
语音增强（SE）面临数据、目标和任务等挑战，自监督学习（SSL）逐渐成为解决方案。SSL通过未配对数据学习和生成式方法，重塑了SE的训练目标。研究表明，S...

LLM探索：GPT类模型的几个常用参数 Top-k, Top-p, Temperature

内容提要

关键要点

标签

继续阅读