RATIONALYST: Pre-training Process Supervision for Enhanced Reasoning
原文英文,约100词,阅读约需1分钟。发表于: 。本研究针对大型语言模型(LLMs)推理步骤不完整的问题,提出了RATIONALYST模型,通过对大量未标注数据中提取的理由注释进行预训练,从而实现推理的过程监督。研究发现,RATIONALYST在七个代表性推理基准上的准确率平均提高了3.9%。
本研究提出RATIONALYST模型,通过预训练未标注数据中的理由注释,解决大型语言模型推理不完整的问题,平均提高七个推理基准的准确率3.9%。