本研究提出了MathCoder-VL,旨在解决多模态模型在数学推理中忽视数学图形细节的问题。通过图像到代码模型FigCodifier及数据集ImgCode-8.6M,合成数学图形并构建MM-MathInstruct-3M数据集,最终在多模态数学问题求解中取得了新成绩。
完成下面两步后,将自动完成登录并继续当前操作。