小红花·文摘

本文介绍了如何通过DeepSeek V3模型API调节温度和top_p参数，以控制模型输出。温度参数影响回答的随机性，低值稳定高值创意；top_p参数控制文本多样性，低值精准高值灵活。两者结合可实现不同场景的输出效果。

开发者必备！基于开发者空间的 DeepSeek 模型 API 调用及参数调试攻略

华为云官方博客 ·

本研究提出了一种新方法，通过调整视觉语言模型的温度参数，优化人类动作识别的分类性能，有效降低分布尾部影响，具有实用价值。

基于视觉语言模型的人类动作识别的保形预测

BriefGPT - AI 论文速递 ·

本文探讨了文本嵌入在长文本中的性能下降，提出了“长度崩溃”现象。通过引入softmax()的温度参数，提出了调节方法TempScale，显著提升了长文本嵌入模型的性能。

Length-Induced Embedding Collapse in Transformer Models

BriefGPT - AI 论文速递 ·

本文研究了调和后验，发现随机性一般情况下不会提高测试准确性，最低温度通常是最优的。使用带有某些随机性的贝叶斯模型会以降低测试准确性的代价为代价。作者讨论了使用贝叶斯模型来定位频率主义指标的需求的最优温度参数 λ 的优化目标的一个简单解释。通过 PAC-Bayesian 分析表明，温度参数 λ 不能简单地被视为修正了先验或似然的错误设置。

钢化后座椅的细节

BriefGPT - AI 论文速递 ·

Andrew Ng's ChatGPT Prompt Course Notes

aaron's notes ·