本研究探讨了图表到文本的自然语言总结方法,介绍了ChartSumm数据集,包含84,363个图表及其描述,旨在支持视障人士和数据模型训练。研究发现现有方法在复杂趋势描述上存在不足,并提出了ChartThinker方法以提高摘要的逻辑性和准确性。实验结果表明,该方法在多个评估指标上优于现有模型,数据集和代码可公开获取。
本研究探讨了图表到文本的自然语言总结方法及神经网络模型,提出了基于视觉的Transformer模型和UniChart强化学习模型,提升了图表分类和总结的表现。同时,构建了多模态评估集ChartX,并开发了ChartVLM模型,推动了图表理解和可视化领域的研究。
完成下面两步后,将自动完成登录并继续当前操作。