GDI-Bench:一个具有视觉与推理解耦的通用文档智能基准
📝
内容提要
本研究针对当前缺乏全面的基准测试以评估多模态大语言模型在文档领域表现的问题,提出了GDI-Bench基准。该基准通过解耦视觉复杂性与推理复杂性,设计了分级任务,有助于识别模型弱点并指导优化,从而在文档特定任务上取得先进性能。
➡️
本研究针对当前缺乏全面的基准测试以评估多模态大语言模型在文档领域表现的问题,提出了GDI-Bench基准。该基准通过解耦视觉复杂性与推理复杂性,设计了分级任务,有助于识别模型弱点并指导优化,从而在文档特定任务上取得先进性能。