理解温度对与人类意见对齐的影响
发表于: 。本研究解决了大语言模型在表示人类意见时的对齐问题,提出了对三种方法的实证分析以获得意见分布。研究表明,通过简单参数调整的采样和对数概率方法在主观任务中能获得更好的对齐输出,强调了进一步研究人类主观性对模型不确定性影响的必要性。
本研究解决了大语言模型在表示人类意见时的对齐问题,提出了对三种方法的实证分析以获得意见分布。研究表明,通过简单参数调整的采样和对数概率方法在主观任务中能获得更好的对齐输出,强调了进一步研究人类主观性对模型不确定性影响的必要性。