URSA: Understanding and Verifying Chain-of-Thought Reasoning in Multimodal Mathematics
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究解决了多模态数学推理中思维链训练数据稀缺的问题,提出了结合CoT蒸馏和轨迹格式重写的综合策略,构建了高质量的CoT推理数据集MMathCoT-1M,并验证了URSA-7B模型在多个基准上的表现,提升了数学推理能力。
🎯
关键要点
- 本研究解决了多模态数学推理中高质量思维链训练数据稀缺的问题。
- 提出了结合CoT蒸馏、轨迹格式重写和格式统一的三模块综合策略。
- 构建了高质量的CoT推理指令微调数据集MMathCoT-1M。
- 验证了训练后的URSA-7B模型在多个基准上的表现。
- 提升了数学推理能力。
➡️