中文多模态数学数据集CMM-Math:评估与提升大型多模态模型的数学推理能力
原文中文,约400字,阅读约需1分钟。发表于: 。本研究针对当前大型语言模型在数学推理方面的不足,提出了一个新的中文多模态数学数据集CMM-Math,以评估和提升大型多模态模型的数学推理能力。研究表明,尽管现有的最先进模型在CMM-Math数据集上表现尚可,但仍面临一些挑战,推动开发更强大的多模态数学模型的必要性。我们的Multimodal Mathematical LMM显示出显著提高数学推理能力的潜力。
FineMath是一个用于评估中文LLMs数学推理能力的数据集,包含小学数学教学的主要概念,划分为17类数学应用问题。实验结果显示中文LLMs的数学推理能力有待提升。作者还分析了之前被忽视的评估过程和方法对结果的影响。数据集将于2024年3月发布。