DEV Community ·

基于LLM模型的RAG应用开发逐步指南 - 第三部分 - 上下文搜索与注入

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

本文介绍了基于LLM模型的RAG应用开发，重点在于通过向量搜索找到合适的上下文。使用句子嵌入生成问题向量，并通过相似度查询获取相关文档。上下文注入显著提升了模型回答质量，强调了开发细节和验证结果的重要性。

🎯

🔎

在RAG应用开发中，向量搜索是关键机制之一。通过生成问题的句子嵌入并进行相似度查询，开发者能够找到与问题最相关的上下文。这种方法不仅提高了模型的回答质量，还能确保提供的信息更具针对性和准确性。

上下文注入显著提升了模型的回答质量。通过将相关文档的完整内容传递给模型，回答变得更加具体和实用。开发者应重视上下文的选择，以确保模型能够提供准确且有用的答案，避免因信息不准确而引发的法律和信任问题。

在开发RAG应用时，细节决定成败。选择合适的LLM模型、嵌入模型以及文档划分方式都至关重要。此外，开发者需对结果进行验证，以确保应用提供的答案准确无误，避免潜在的法律风险和用户信任问题。

❓

通过生成问题的句子嵌入，然后使用VECTOR_DOT_PRODUCT或VECTOR_COSINE进行相似度查询，以找到与问题最相关的文本。

上下文注入显著提升了模型的回答质量，使得回答更加具体和准确。

需要考虑使用的LLM模型、嵌入模型、文档划分方式以及结果验证等因素。

使用句子嵌入模型，如sentence-transformers，来编码问题并生成向量。

VECTOR_DOT_PRODUCT是向量元素乘积的和，而VECTOR_COSINE是标量积除以向量长度的乘积，后者更适合处理非单位向量。

上下文的选择直接影响模型获取的信息质量，从而影响回答的准确性和相关性。

🏷️