Stack Overflow Blog ·

分块很难做到：RAG 应用中的分块策略

💡 原文英文，约1600词，阅读约需6分钟。

📝

内容提要

构建基于LLM的应用时，需要将LLM的响应与源数据结合。检索增强生成（RAG）通过创建文本嵌入实现这一目标。数据分块（chunking）对搜索结果的相关性至关重要，常见的分块策略包括固定大小、随机大小和上下文感知分块。选择合适的分块方法需根据具体用例进行测试，以确保AI模型能准确响应用户查询。

🎯

关键要点

构建基于LLM的应用时，需要将LLM的响应与源数据结合。
检索增强生成（RAG）通过创建文本嵌入来实现这一目标。
数据分块（chunking）对搜索结果的相关性至关重要。
常见的分块策略包括固定大小、随机大小和上下文感知分块。
选择合适的分块方法需根据具体用例进行测试。
分块数据的大小会影响搜索结果的准确性。
过大的分块会导致向量失去特异性，过小的分块则会失去上下文。
使用元数据可以帮助过滤和链接内容。
固定大小分块适用于同质数据集，但可能忽略上下文。
随机大小分块可以捕捉多样的语义上下文，但可能导致无意义的分块。
滑动窗口方法可以更好地捕捉上下文，但需要更多存储空间。
上下文感知分块基于标点符号或标签进行分割，能提高语义相关性。
自适应分块根据内容动态调整分块大小，计算需求较高。
测试分块方法时，应根据样本查询评估结果。
分块只是生成AI技术的一部分，还需要LLM、向量数据库和存储。

❓

延伸问答

什么是检索增强生成（RAG）？

检索增强生成（RAG）是一种通过创建文本嵌入，将LLM的响应与源数据结合的方法。

数据分块在RAG系统中有什么重要性？

数据分块对搜索结果的相关性至关重要，分块的大小会影响信息的准确性和上下文。

有哪些常见的数据分块策略？

常见的数据分块策略包括固定大小分块、随机大小分块、上下文感知分块和自适应分块。

如何选择合适的数据分块方法？

选择合适的分块方法需根据具体用例进行测试，以确保AI模型能准确响应用户查询。

上下文感知分块的优势是什么？

上下文感知分块基于标点符号或标签进行分割，能提高语义相关性。

自适应分块的特点是什么？

自适应分块根据内容动态调整分块大小，计算需求较高，但能生成高度定制的语义单元。

🏷️

继续阅读

[MAF预定义ChatClient中间件-03]CachingChatClient——利用缓存省钱省时间 - Artech
CachingChatClient是一个中间件，用于缓存LLM调用结果，减少重复调用的时间和费用。它通过检查缓存返回相同输入的响应，若不存在则调用LLM并...
如何降低AI对话开发成本及部署AI对话开发应用？
AI对话项目在规模化运营后，成本控制成为关键。主要成本包括算力、带宽、服务器和数据迭代。优化路径包括利用成熟平台、模型分级调度、资源优化和建立成本监控体系...
为什么中端市场买家正在重新思考他们的 UCaaS 策略
中型企业正在重新审视通信平台，强调集成、运营效率和合规性。它们快速采用统一通信（UC）平台，但面临资源不足的挑战。集成与行业特定系统的兼容性成为关键，许多...
早报｜苹果App Store四成头部应用已支持AI/千问上线肯德基skill/奈雪擦边LABUBU被判赔32万
腾讯客服表示，微信与华为、小米等厂商合作推出A2A助手，用户可通过AI助手发起微信通话或发送消息。荣耀部分机型已支持此功能，确保数据安全与隐私。
模型评估：证明您的路由策略确实有效
本文介绍了DigitalOcean的模型评估功能，帮助团队在真实工作负载下评估不同的推理策略。用户可以通过比较多种模型和路由策略来优化成本、延迟和输出质量...
Gemma 4 QAT models: Optimizing model compression for mobile and laptop efficiency
Gemma 4 Quantization-Aware Training (QAT)