小红花·文摘

介绍了最小p采样方法，可提升大模型数学能力20%，平衡连贯性和多样性。已在Mistral-7B和Llama3-70B上测试，获得广泛应用。核心是动态调整抽样阈值，取得在推理任务、数学类任务和创意写作中的良好效果。