本研究解决了多模态数学推理中思维链训练数据稀缺的问题,提出了结合CoT蒸馏和轨迹格式重写的综合策略,构建了高质量的CoT推理数据集MMathCoT-1M,并验证了URSA-7B模型在多个基准上的表现,提升了数学推理能力。
完成下面两步后,将自动完成登录并继续当前操作。