EnterpriseRAG-Bench是一个针对企业内部知识检索的基准测试,旨在解决现有RAG基准在处理企业文档分散、格式多样和信息过时等问题上的不足。该基准包含50万份文档和500道问题,模拟真实企业环境,评估系统在信息检索、文档聚合和处理噪声方面的能力,强调多文档整合和对内部术语的理解,适合企业内网的知识检索应用。
Databricks推出了GPT-5.5,显著提升了复杂企业文档任务的处理能力。与GPT-5.4相比,GPT-5.5在OfficeQA Pro上减少了46%的错误,首次实现超过50%的准确率,尤其在解析扫描PDF和旧文件时表现出色,改善了多步骤任务的协调性。客户可通过AI Unity Gateway使用GPT-5.5,提升定制代理工作流的效率。
DocsGPT是一个开源文档代理平台,支持多种格式(如PDF、DOCX),结合检索增强生成(RAG)和大型语言模型,提供引用支持的答案。适用于企业文档搜索、内部知识助手和合规调查,支持云服务和自托管部署。
IBM研究推出了Granite-Docling-258M,这是一种开源视觉语言模型,专注于高保真文档转文本转换,能够保留复杂的布局和结构。尽管参数仅有2.58亿,但其准确性与更大模型相当,适合文档解析和数据集准备。该模型支持多语言,旨在与Docling库结合,优化企业文档工作流程。
Onyx是一个开源生成AI搜索引擎,提供智能搜索和RAG解决方案,支持企业文档和公共网站。其模块化设计使用户完全控制数据,并支持多种部署方式。Onyx能够自动更新索引,适合处理大量文档,提升企业效率。
完成下面两步后,将自动完成登录并继续当前操作。