利用大语言模型与 RAG 架构构建智能化 Support Case 问答系统

1. 引言在云计算环境中，快速响应和解决客户问题至关重要。亚马逊云科技技术支持案例是客户与亚马逊云科技支持团 […]

本文介绍了如何利用大语言模型（LLM）自动化处理亚马逊云科技的技术支持案例，并将内容导入Dify知识库，构建基于RAG的支持机器人。目标是提升响应速度、知识积累和新员工培训效率，未来将优化模型并扩展功能。

RAG 大语言模型技术支持知识库自动化

原文中文，约5700字，阅读约需14分钟。发表于：。

阅读原文

分享给好友

RAG-MCP 性能剖析：在 Amazon Bedrock 中多维度测试提示词优化的效果

RAG-MCP 框架在 Amazon Bedrock 环境中的性能表现。通过多维度测试，对 RAG 在 Tool 调用时产生的价值做了评估。

RAG-MCP框架通过语义检索优化工具调用，解决了大语言模型的提示词膨胀问题，显著降低了令牌使用和响应时间，同时提高了准确率。实验结果表明，RAG-MCP在性能上优于全工具MCP，适合大规模应用。

RAG-MCP bedrock mcp rag 大规模应用工具调用性能提示词语义检索

RAG-MCP 性能剖析：在 Amazon Bedrock 中多维度测试提示词优化的效果

原文中文，约9100字，阅读约需22分钟。发表于：。

阅读原文

分享给好友

在 Amazon Bedrock 中结合 RAG 与 MCP 高效缓解提示词膨胀问题

本文详细介绍了在 Amazon Bedrock 中结合 RAG 与 MCP 来解决大语言模型工具选择中的提示词膨胀问题。文章阐述了 RAG-MCP 的架构设计、实现步骤和优化策略，包括工具数据获取、向量化存储和语义检索等核心环节。

大语言模型（LLM）在处理复杂任务时存在提示词膨胀问题。AWS Bedrock Knowledge Bases结合检索增强生成（RAG）和模型上下文协议（MCP），通过动态选择工具的向量数据库，减少提示词长度，提高推理效率和准确性。本文探讨RAG-MCP架构设计及实现步骤，为开发者提供实践参考。

MCP RAG bedrock 大语言模型推理效率提示词提示词膨胀

在 Amazon Bedrock 中结合 RAG 与 MCP 高效缓解提示词膨胀问题

原文中文，约21100字，阅读约需51分钟。发表于：。

阅读原文

分享给好友

使用DeepEval和LlamaIndex评估RAG

This is a guest post from one of our partners.IntroductionDeepEval is an open-source LLM evaluation library in Python that enables engineers to unit test all types of LLM applications—whether...

DeepEval是一个开源Python库，用于评估各种LLM应用，提供50多种度量标准。结合LlamaIndex框架，用户可以构建复杂的RAG管道，通过定义答案相关性、忠实度和上下文精度等度量标准，优化模型性能并进行有效评估。

DeepEval LLM应用 Python库 RAG管道 llamaindex rag 度量标准

原文英文，约1100词，阅读约需4分钟。发表于：。

阅读原文

分享给好友

GraphRAG与RAG的细微差别

While large language models (LLMs) hold immense promise for building AI applications and agentic systems, ensuring they generate reliable and The post Navigating the Nuances of GraphRAG vs. RAG...

大型语言模型（LLMs）在生成可靠输出时面临挑战。检索增强生成（RAG）通过外部知识改善这一问题，但基于向量的方法在处理复杂关系时存在局限。GraphRAG结合知识图谱，提升了准确性和可解释性，适合多跳推理。选择RAG或GraphRAG应根据具体应用需求。

GraphRAG rag 多跳推理大型语言模型检索增强生成知识图谱

原文英文，约1600词，阅读约需6分钟。发表于：。

阅读原文

分享给好友

5 Advanced RAG Architectures Beyond Traditional Methods

Retrieval-augmented generation (RAG) has shaken up the world of language models by combining the best of two worlds:

rag

发表于：。

阅读原文

分享给好友

LlamaCloud扩展企业级RAG的四种方式

LlamaIndex is an industry-leading set of frameworks for building generative AI agents, with its roots in the understanding that your results are only as good as your data. Getting that data from...

LlamaIndex是一个生成AI代理的框架，解决数据获取、解析和检索问题。LlamaCloud平台简化企业级应用扩展，关注多租户系统的资源分配和访问控制。LlamaParse能够将多种格式转换为标准文本，支持文档解析和故障处理，帮助用户专注于核心应用开发。

LlamaCloud LlamaIndex rag 多租户故障处理文档解析

原文英文，约1200词，阅读约需5分钟。发表于：。

阅读原文

分享给好友

爆改RAG！用“上下文压缩”让你的AI检索系统又快又准

别急，今天教你一招“上下文压缩”，让你的RAG系统脱胎换骨，效率翻倍，答案更准，内存更省，老板看了都说好！”，检索出来的段落里，既有“AI的历史”，又有“AI的优点”，还有“AI的缺点”，真正和伦理相关的内容，可能只占三分之一。对每个检索到的chunk，调用大模型，按指定压缩方式（Selective/Summary/Extraction）处理，只保留和问题相关的内容。RAG系统的本质，就是“...

RAG（检索增强生成）系统通过上下文压缩技术提高检索效率和答案准确性。上下文压缩包括选择性保留、摘要和句子抽取三种方式，能有效减少无关信息。通过预处理、向量化、压缩和生成答案，RAG系统优化文档处理，节省内存并加快推理速度。

RAG ai 上下文压缩文档处理检索效率答案准确性

原文中文，约6100字，阅读约需15分钟。发表于：。

阅读原文

分享给好友