Chart-HQA: A Benchmark for Hypothetical Question Answering in Charts

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的图表假设问答(HQA)任务,解决了现有基准测试中多模态大型语言模型(MLLMs)输出偏差的问题。通过HAI方法低成本生成多样化的HQA数据,结果表明当前模型在HQA任务上面临泛化挑战和推理性能不平衡。

🎯

关键要点

  • 本研究提出了一种新的图表假设问答(HQA)任务,旨在解决现有基准测试中多模态大型语言模型(MLLMs)输出偏差的问题。
  • HQA任务要求模型基于图表内容进行反事实推理。
  • 引入HAI方法以低成本生成多样化、高质量的HQA数据。
  • 研究结果表明,当前模型在HQA任务上面临显著的泛化挑战和推理性能不平衡的问题。
➡️

继续阅读