Surmon.me ·

创造力是温柔的谎言

💡 原文中文，约5900字，阅读约需14分钟。

📝

内容提要

大模型生成文本时，通过预测下一个词元输出，使用Temperature、Top-p和Top-k参数控制输出的随机性和创造性。Temperature调节概率分布的尖锐程度，Top-k和Top-p限制候选词元的数量和概率密度。这些方法旨在提高生成内容的多样性和创造性，但模型仍基于概率随机选择，缺乏真正的创造过程。

🎯

关键要点

大模型生成文本时，通过预测下一个词元输出，使用Temperature、Top-p和Top-k参数控制输出的随机性和创造性。
Temperature调节概率分布的尖锐程度，数值越高，输出越随机，越富有创造性；数值越低，输出越确定，越保守。
模型在输出文本时，实际上是逐个词元地预测，经过生成分数、转换概率和加权采样三个步骤。
贪心解码策略选择分值最高的词元，容易导致输出重复，而束搜索则保留多个候选路径，但计算成本高且输出保守。
随机采样通过Softmax函数将分数转换为概率，使得每个词元都有被选中的机会，增加了输出的多样性。
Top-k和Top-p方法在随机采样中排除低概率词元，Top-k固定候选词元数量，Top-p固定候选词元的概率密度。
调高Temperature或拓宽Top-p阈值可以增加模型的创造力，但模型本身并不具备真正的创造过程。
AI生成的内容虽然可以满足人们对创造力的需求，但并不代表模型具备意识或灵感。

❓

延伸问答

大模型生成文本时如何控制输出的随机性和创造性？

通过调整Temperature、Top-p和Top-k参数来控制输出的随机性和创造性。

Temperature参数的作用是什么？

Temperature参数调节概率分布的尖锐程度，数值越高，输出越随机和创造性；数值越低，输出越确定和保守。

贪心解码和束搜索有什么区别？

贪心解码选择分值最高的词元，容易导致重复；束搜索保留多个候选路径，计算成本高但输出更灵活。

随机采样是如何增加输出多样性的？

随机采样通过Softmax函数将分数转换为概率，使每个词元都有被选中的机会，从而增加输出的多样性。

Top-k和Top-p方法有什么不同？

Top-k固定候选词元数量，而Top-p固定候选词元的概率密度，二者在处理长尾词时的策略不同。

AI生成的内容是否具备真正的创造力？

AI生成的内容虽然看似创造性，但实际上缺乏真正的创造过程，只是在概率公式中随机选择词元。

🏷️

继续阅读

亚马逊的新游戏计划：詹姆斯·邦德与人工智能史努比狗
亚马逊正在调整游戏战略，专注于云游戏和休闲游戏，特别是通过Luna平台。公司计划推出以詹姆斯·邦德为主题的游戏，并强调视频游戏与影视内容的结合，旨在吸引更...
Asana称其新的AI“首席助理”将您的Slack混乱转化为可追踪的工作
Asana在伦敦的工作创新峰会上推出了名为Dash的AI助手，旨在提升工作管理平台的效率。Dash能够从会议、Slack和邮件中捕捉待办事项，并将其转化为...
Nvidia最新模型现已上线
Nvidia发布了Nemotron 3 Ultra模型，拥有5500亿参数，支持高达100万标记的上下文窗口。该模型速度显著提升，能节省用户30%的成本。...
国家科学基金会续资麻省理工学院主导的人工智能与物理学研究所，扩展新的发现模式
麻省理工学院主导的人工智能与基础相互作用研究所（IAIFI）获得国家科学基金会续资，年资助额从400万美元增至498万美元。IAIFI致力于将人工智能与物...
Kaggle 使 AI 基准创建变得轻而易举
Kaggle Benchmarks推出本地开发功能，允许开发者在本地环境中创建和验证评估任务。该功能支持使用AI编码代理通过自然语言构建任务，旨在加速AI...
帮助出版商和创作者在搜索中突出展示他们的作品的新个人资料
谷歌推出搜索个人资料功能，帮助出版商和创作者展示内容，用户可通过移动设备关注创作者以获取更新。符合条件的出版商和创作者可以自定义个人资料，并可能触发知识面...