小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
RAG中的分块:策略、权衡与常见错误

本文讨论了在检索增强生成(RAG)管道中,文档分块的重要性。分块策略影响检索精度、索引大小和查询延迟。常见的分块方法包括固定大小分块、递归分块和语义分块。选择合适的分块策略需考虑文档类型和查询模式。较小的分块适合精确检索,而较大的分块则有助于叙述性查询。

RAG中的分块:策略、权衡与常见错误

Redis Blog
Redis Blog · 2026-04-13T00:00:00Z

检索增强生成(RAG)系统是大型语言模型的自然演变,旨在克服传统模型的局限性。文章总结了构建RAG系统的七个关键步骤,包括数据源选择与清理、文档分块和向量化等。这些步骤确保生成基于证据的准确回答,从而提高LLM应用的可靠性和知识密集度。

掌握检索增强生成的七个步骤

KDnuggets
KDnuggets · 2026-04-07T14:00:59Z
LLM应用的上下文窗口管理:速度与成本优化

上下文窗口管理对LLM应用性能至关重要。过多的token会导致延迟和质量下降,尤其在长文本中信息易被忽视。有效管理需优化token使用,采用智能文档分块和混合检索策略,并监测性能以降低成本。

LLM应用的上下文窗口管理:速度与成本优化

Redis Blog
Redis Blog · 2026-02-17T00:00:00Z
戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

本文介绍如何使用pgEdge Vectorizer将文档分块并生成向量嵌入,以实现基于语义的搜索。通过将文档拆分为小块,系统能够更精确地检索相关内容。pgEdge Vectorizer作为PostgreSQL扩展,自动处理文档更新和嵌入生成,简化管理流程。

戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

Planet PostgreSQL
Planet PostgreSQL · 2025-12-09T06:30:44Z
构建更优秀的语言模型应用的关键分块技术

在构建检索增强生成(RAG)应用时,文档分块至关重要,影响信息检索和生成的准确性。常见的分块策略有固定大小、递归、语义和文档基础等。选择合适的分块方法需考虑文档特性和检索需求,以提升系统性能。

构建更优秀的语言模型应用的关键分块技术

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-06T11:00:54Z

本研究提出了HOPE指标,分析文档分块对检索增强生成系统的影响。结果表明,该指标与RAG性能显著相关,为优化分块策略提供了新见解。

新的HOPE:领域无关的文本分块自动评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-04T00:00:00Z
从零开始的检索增强生成(RAG)——傻瓜教程

本文介绍了检索增强生成(RAG)系统的概念及实现方法。RAG通过文档分块、嵌入和索引,帮助AI准确回答特定文档的问题。使用PocketFlow框架,用户可轻松构建RAG系统,提高AI响应的准确性和相关性。

从零开始的检索增强生成(RAG)——傻瓜教程

DEV Community
DEV Community · 2025-03-31T17:13:11Z
理解检索增强生成(RAG)第五部分:管理上下文长度

本文讨论了在检索增强生成(RAG)系统中管理上下文长度的四种策略:文档分块、选择性检索、针对性检索和上下文摘要。这些策略旨在提高信息检索效率,并确保在大型语言模型(LLM)输入限制内传递关键信息。尽管长上下文LLM在某些情况下表现优越,但RAG系统在动态信息检索中仍具优势。

理解检索增强生成(RAG)第五部分:管理上下文长度

MachineLearningMastery.com
MachineLearningMastery.com · 2025-02-18T11:00:38Z
晚分块的真正含义与误解:第二部分

文章讨论了文档分块中的断点选择和上下文丢失问题。传统方法在分块后嵌入,导致上下文丢失。晚分块方法先编码整个文档,再根据断点进行均值池化,保留全局上下文。实验显示,晚分块对断点不敏感,性能优于传统方法,无需额外训练,适合长上下文嵌入,比使用LLM更高效。

晚分块的真正含义与误解:第二部分

Jina AI
Jina AI · 2024-10-03T17:19:16Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码