小红花·文摘

本文讨论了大模型输出的两个重要超参数：温度（Temperature）和核采样（Top-p）。温度控制输出的随机性，低温度使输出更确定，高温度增加多样性。核采样通过动态截断低概率词来调整候选词范围。建议在需要确定性时使用低温度和低Top-p，而在追求创意时使用高温度和高Top-p。默认配置为温度0.7和Top-p 0.9，适合大多数场景。

大模型 Temperature 与 Top_p/Top_k 参数详解

安志合的学习博客 ·

本文探讨了视觉对话任务中的解码策略，分析了不同策略的优缺点。研究表明，核采样在质量优先时表现最佳，并提出了“选择性抽样”算法以提高多样性和连贯性。此外，动态词汇序列模型（DVS2S）显著提升了聊天机器人回答的质量和解码效率。

开放领域对话生成的动态随机解码策略

BriefGPT - AI 论文速递 ·

本文探讨了大语言模型（LLM）采样算法的改进，特别是核采样（top-p）的问题。作者提出了一种新的“首个令牌截止”（FTC）算法，旨在提高生成文本的质量和多样性，通过限制低质量令牌的选择比例，确保生成内容的连贯性和准确性。

首个令牌截止大语言模型采样

<antirez> ·