小红花·文摘

本研究解决了多模态数学推理中思维链训练数据稀缺的问题，提出了结合CoT蒸馏和轨迹格式重写的综合策略，构建了高质量的CoT推理数据集MMathCoT-1M，并验证了URSA-7B模型在多个基准上的表现，提升了数学推理能力。