URSA:理解和验证多模态数学中的思维链推理

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究针对多模态数学推理中高质量思维链训练数据稀缺的问题,提出了三模块综合策略,构建了MMathCoT-1M数据集,并验证了URSA-7B模型的推理能力提升。

🎯

关键要点

  • 本研究解决了多模态数学推理中高质量思维链训练数据稀缺的问题。
  • 高质量思维链数据的稀缺限制了现有模型的推理精度。
  • 提出了结合CoT蒸馏、轨迹格式重写和格式统一的三模块综合策略。
  • 构建了高质量的CoT推理指令微调数据集MMathCoT-1M。
  • 验证了训练后的URSA-7B模型在多个基准上的表现。
  • 推动了数学推理能力的提升。
➡️

继续阅读