JinaVDR是一个新基准,用于评估模型在检索多语言、复杂布局的视觉文档方面的表现,结合文本、图表和图像,通过多种任务反映真实世界文档的复杂性和多样性。
本研究提出了ViDoRAG,一个新型多代理框架,旨在提高传统检索增强生成方法在处理视觉文档时的效率和推理能力。该方法通过混合策略和迭代代理工作流,显著提升了复杂推理能力,并在ViDoSeek基准测试中超越现有方法超过10%。
该工具简化了软件开发中的视觉文档生成,用户只需按特定格式输入结构,工具便可自动生成UML、schema和ER图,并支持导出为图像,从而节省时间并提高准确性。
完成下面两步后,将自动完成登录并继续当前操作。