钟意博客 ·

大语言模型的不确定性

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

在实际工程中，即使温度设为0且随机种子固定，LLM的输出仍无法完全一致，原因包括采样配置、浮点误差和调度策略等。因此，追求严格的确定性不现实，需通过参数控制和架构设计实现业务可接受的稳定性。

🎯

❓

即使设置temperature为0和固定随机种子，输出仍无法保证一致，原因包括采样配置、浮点误差和调度策略等。

应通过参数控制、架构设计和缓存机制来实现业务可接受的稳定性，而非追求数学上的完全一致。

建议使用极小的temperature值，锁定top_p为1，n设置为1，避免多候选采样。

在云端API上追求位级确定性是不切实际的，因存在多种物理层面的随机性。

应严格归一化输入，确保在调用前对Prompt进行字节级清洗，剔除不可见字符。

大语言模型更适合作为辅助决策工具，而非唯一的权威判官，适合强一致性需求的环节。

🏷️

乌迈尔·沙希德：最佳PostgreSQL数据库故意选择无趣
文章讨论了PostgreSQL数据库的稳定部署的重要性。稳定意味着高效，减少故障和紧急修复。通过定期检查、调整参数和备份演练，团队可以提高客户信任，节省时...
世界最差程序员变得主动：构建一个破解排行榜的AI
一位自称“世界最差程序员”的新手，通过AI工具学习编程，成功创建了一个连接公司知识库的代理，帮助他在内部排行榜上获得第一名。尽管编程仍然困难，但这个项目让...
再见面板：Debian构建WordPress
任务要求：使用Debian纯命令行构建自己的WordPress网站，并通过一些方法支持http://linli […] 再见面板：Debian构建Word...
欢迎参加2026年6月9日的PHPverse活动
JetBrains PHPverse – a community-inspired professional event for PHP develope...
安博瑞克的新款旋转屏手持游戏机起售价低于100美元
Following its sliding screen handheld that debuted last June with a design th...
这些智能眼镜都没什么用
智能眼镜虽然时尚、舒适且功能强大，但尚未实现预期的生活改变。它们提供便利，如导航和信息显示，但大多数AI功能仍不够实用，隐私问题也令人担忧。用户对这些设备...