Sekyoro的博客小屋 ·

Agentic RAG and LLMs-based assistant

💡 原文中文，约14600字，阅读约需35分钟。

📝

内容提要

AI Agent和RAG在多模态大模型的基础上发展应用，通过智能体和外部数据进行搜索。由于大模型参数庞大，普通用户可以使用开源模型如llama。RAG通过检索增强生成，提高了大模型的响应质量，适合用于文档写作等场景。

🎯

🔎

RAG（检索增强生成）通过提供额外的上下文来提升大模型的响应质量，尤其在处理最新信息时表现突出。然而，它的局限性在于检索步骤的单一性和语义相似度计算的潜在偏差，可能导致相关信息的丢失。用户在使用时需注意这些限制，确保检索结果的准确性。

随着大模型的普及，开源模型如llama为普通用户提供了微调和应用的机会。这使得开发者能够在不依赖昂贵服务的情况下，利用开源工具进行创新和实验。未来，开源模型可能成为更多应用的基础，推动AI技术的普及与发展。

多模态大模型结合了文本、图像等多种数据形式，展现出强大的应用潜力。随着技术的进步，未来可能会出现更多集成多种功能的智能体，提升用户体验和工作效率。关注这些技术的发展将有助于把握未来AI应用的趋势。

❓

RAG（检索增强生成）是一种方法，通过向大语言模型提供从相关数据中检索的附加上下文，来生成更明智的响应，解决模型无法意识到特定内容的问题。

普通用户可以使用开源模型如llama进行微调等操作，以适应特定需求。

RAG的工作流程包括加载数据、分块、创建embedding和retriever。

RAG通过检索增强生成，提供相关上下文，从而提高大模型的响应质量，适合用于文档写作等场景。

RAG的局限性在于检索步骤和语义相似度计算，可能导致生成结果的质量不佳。

结合LLM和retriever可以通过迭代询问和检索相关信息来提升回答质量。

🏷️