Blog on LlamaIndex ·

使用Nomic Embed和LlamaIndex构建一个完全开源的检索器

💡 原文英文，约1000词，阅读约需4分钟。

📝

内容提要

本文介绍了如何使用LlamaIndex和Nomic Embed构建一个完全开源的检索器。通过结合检索器和数据库，检索增强生成（RAG）提升了语言模型的响应质量和知识更新能力。开源模型确保了可审计性，避免了对闭源模型的依赖。文章还提供了具体的代码示例，展示了数据库的设置和检索功能的实现。

🎯

检索增强生成（RAG）通过结合检索器和数据库，提高了语言模型的响应质量和知识更新能力。
使用LlamaIndex和Nomic Embed构建完全开源的检索器，Nomic Embed是首个在短期和长期上下文基准上超越OpenAI Ada性能的开源嵌入模型。
开源模型确保了整个系统的可审计性，避免了对闭源模型的依赖，减少了供应商锁定的风险。
构建检索器的步骤包括导入相关库、下载数据、获取文档的向量表示以及设置检索器。
使用LlamaIndex和Nomic Embed，可以轻松构建检索器并根据用户查询返回相关文档。

❓

首先导入相关库，下载数据，然后获取文档的向量表示，最后设置检索器。

Nomic Embed是首个在短期和长期上下文基准上超越OpenAI Ada性能的开源嵌入模型。

开源模型确保了可审计性，避免了对闭源模型的依赖，减少了供应商锁定的风险。

RAG通过结合检索器和数据库，帮助语言模型减少幻觉，提高响应质量和知识更新能力。

使用LlamaIndex可以通过设置检索器并输入用户查询来返回相关文档。

需要导入llama_index.embeddings中的NomicEmbedding和其他相关库。

🏷️