小红花·文摘

本文介绍了多模态评估集ChartX及其新模型ChartVLM，评估了多种图表类型和任务，显示ChartVLM在图表理解上优于其他模型。此外，研究提出了ChartMimic基准，评估大型多模态模型的视觉代码生成能力，强调了视觉理解和跨模态推理中的挑战。实验揭示了现有模型在图表理解中的局限性，并为未来研究提供了方向。