小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大型语言模型如何选择词汇:Logits、Softmax与采样的实用指南

本文探讨了大型语言模型(LLMs)在相同提示下生成多样化和创造性输出的机制,分析了采样策略及温度、top-k、top-p等参数对输出一致性和创造性的影响。通过实例,读者将掌握如何调整LLM的输出特性。

大型语言模型如何选择词汇:Logits、Softmax与采样的实用指南

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-13T19:25:32Z
理解变换器中的文本生成参数

本文探讨了变换器模型中控制文本生成的关键参数,包括温度、Top-K和Top-P采样、重复惩罚等。通过调整这些参数,可以优化生成文本的质量和多样性。低温度产生更确定的输出,高温度则增加创造性。Top-K和Top-P控制可选词汇范围,避免重复的参数有助于生成更自然的文本。此外,介绍了贪婪解码和束搜索等生成策略,以满足不同应用需求。

理解变换器中的文本生成参数

MachineLearningMastery.com
MachineLearningMastery.com · 2025-04-21T10:38:33Z
使用最大堆优化 Top K 元素问题

Top K 元素算法用于高效查找列表中频率最高的 k 个元素。通过使用最大堆,仅存储前 k 个元素,时间复杂度优化至 O(n log k),显著提升大数据集的处理性能。

使用最大堆优化 Top K 元素问题

DEV Community
DEV Community · 2025-04-09T17:59:08Z

该研究提出了一种改进的稀疏自编码器方法BatchTopK,通过放宽top-k约束,提升了重构效果,同时保持了平均稀疏度。实验结果表明,BatchTopK在重构激活方面优于传统TopK SAEs,并与JumpReLU SAEs的性能相当。

批量TopK稀疏自编码器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本文探讨了如何通过放宽Top-K精确要求来提高在高度并行的机器学习加速器上的并行性。研究表明,近似Top-K算法能有效提升稀疏性算法在语言模型中的性能。

Bucket-Based Approximate Top-K Algorithms for Enhanced Parallelism

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

TopK算法用于在未排序的数组中找到最大或最小的K个元素。常见的两种CPU TopK算法是O(N + KlogN)和O(N)算法。第一种算法使用堆构建和堆提取操作,时间复杂度为O(N + KlogN)。第二种算法使用中位数选择算法和线性扫描或分区算法,时间复杂度为O(N)。两种算法都可以在C++中实现。

CPU TopK算法

Lei Mao's Log Book
Lei Mao's Log Book · 2024-03-01T08:00:00Z

本文介绍了使用ChatGPT接口或本地部署LLM大模型时常用的三个参数:temperature、top_k和top_p,它们可以影响模型输出的随机性和候选词选择。同时提供了调参建议和注意事项。

LLM探索:GPT类模型的几个常用参数 Top-k, Top-p, Temperature

dotNET跨平台
dotNET跨平台 · 2023-05-25T00:00:51Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码