DocsGPT是一个开源文档代理平台,支持多种格式(如PDF、DOCX),结合检索增强生成(RAG)和大型语言模型,提供引用支持的答案。适用于企业文档搜索、内部知识助手和合规调查,支持云服务和自托管部署。
IBM研究推出了Granite-Docling-258M,这是一种开源视觉语言模型,专注于高保真文档转文本转换,能够保留复杂的布局和结构。尽管参数仅有2.58亿,但其准确性与更大模型相当,适合文档解析和数据集准备。该模型支持多语言,旨在与Docling库结合,优化企业文档工作流程。
Onyx是一个开源生成AI搜索引擎,提供智能搜索和RAG解决方案,支持企业文档和公共网站。其模块化设计使用户完全控制数据,并支持多种部署方式。Onyx能够自动更新索引,适合处理大量文档,提升企业效率。
完成下面两步后,将自动完成登录并继续当前操作。