量子位 ·

10行代码让大模型数学提升20%，“野路子”研究谷歌也测上了

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

介绍了最小p采样方法，可提升大模型数学能力20%，平衡连贯性和多样性。已在Mistral-7B和Llama3-70B上测试，获得广泛应用。核心是动态调整抽样阈值，取得在推理任务、数学类任务和创意写作中的良好效果。

🎯

❓

最小p采样是一种动态截断抽样方法，旨在平衡生成文本的连贯性和多样性。

该方法通过动态调整抽样阈值，优化采样过程，从而提升大模型在数学类任务中的表现。

在推理任务中，min-p比top-p表现更稳定；在数学任务中，min-p的表现优于top-p；在创意写作中，min-p生成的内容更具创意。

其核心机制是根据每一步token分布的最大概率动态调整最小概率阈值，以优化采样池。

在高温度条件下，min-p能够更好地保持输出的连贯性，确保生成文本的质量。

该方法已在Mistral-7B和Llama3-70B等大模型上测试，并获得广泛应用，尤其是在推理、数学和创意写作任务中。

🏷️