使用OmniThought进行推理:一个具有丰富性和认知难度注释的大型CoT数据集

📝

内容提要

本研究针对大型推理模型(LRMs)面临的全面CoT数据集缺乏的问题,提出了OmniThought,一个包含200万条CoT过程的数据集,经过两个强大的LRMs验证生成。每个CoT过程被标注了新的推理丰富性(RV)和认知难度(CD)评分,显著提升了LRMs在复杂任务训练中的有效性,进而推动了LRMs的开发和训练。

🏷️

标签

➡️

继续阅读