小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
RAG中的分块:策略、权衡与常见错误

本文讨论了在检索增强生成(RAG)管道中,文档分块的重要性。分块策略影响检索精度、索引大小和查询延迟。常见的分块方法包括固定大小分块、递归分块和语义分块。选择合适的分块策略需考虑文档类型和查询模式。较小的分块适合精确检索,而较大的分块则有助于叙述性查询。

RAG中的分块:策略、权衡与常见错误

Redis Blog
Redis Blog · 2026-04-13T00:00:00Z
提升检索增强生成(RAG)准确性的10种技术

检索增强生成(RAG)通过在特定领域的验证上下文中提升大型语言模型(LLM)的输出准确性。建议从简单的RAG管道入手,逐步优化检索、模型专精和答案稳定性。采用混合搜索、调整HNSW索引和优化文档分块等技术,可以显著提高检索精度和生成质量。

提升检索增强生成(RAG)准确性的10种技术

Redis Blog
Redis Blog · 2026-02-25T00:00:00Z
Agent 教程笔记(Task03)

记忆与检索系统设计包括工作记忆、情景记忆、语义记忆和感知记忆,支持个性化服务。RAG系统通过外部知识库增强模型能力,结合多查询扩展和假设文档嵌入提高检索精度,形成完整闭环。

Agent 教程笔记(Task03)

程序员充电站
程序员充电站 · 2025-12-21T14:55:57Z

中国联通研究团队在AAAI 2026上发布了HiMo-CLIP模型,解决了长文本图像检索中的语义层级和单调性问题。该模型通过动态特征提取和对齐机制,显著提高了长短文本的检索精度,性能优于现有模型。

让大模型学会“高维找茬”,中国联通新研究解决长文本图像检索痛点|AAAI 2026 Oral

量子位
量子位 · 2025-12-01T08:49:46Z
StackAI通过LlamaCloud提升企业文档代理的高精度检索

StackAI通过LlamaCloud提升企业文档代理的检索精度,利用LlamaParse API快速处理复杂文档,动态调整解析质量,显著提高处理准确性和效率,增强客户信任。

StackAI通过LlamaCloud提升企业文档代理的高精度检索

Blog on LlamaIndex
Blog on LlamaIndex · 2025-08-20T00:00:00Z

语义分块RAG方法通过计算句子间的语义相似度进行智能分块,从而提高检索精度。该方法利用百分位数等技术识别语义断点,将文本划分为连贯的块,并支持多种断点检测方式。

RAG系列-语义分块RAG(Semantic Chunking RAG)

Ethan's Blog
Ethan's Blog · 2025-06-17T16:00:00Z

语义分块RAG方法通过计算句子间的语义相似度进行智能分块,提升检索精度。该方法利用百分位数等技术找到语义断点,将文本分割成连贯块,适用于长文档处理和复杂问答系统。

RAG系列-语义分块RAG(Semantic Chunking RAG)

Ethan's Blog
Ethan's Blog · 2025-06-17T16:00:00Z
miniCOIL:通往可用稀疏神经检索的道路

miniCOIL是一种轻量级的稀疏神经检索模型,旨在结合BM25的优点,克服传统稀疏检索的局限性。该模型通过语义理解提升检索精度,特别适用于文档搜索,测试结果显示其在多个领域略优于BM25,展现了稀疏神经检索的潜力。

miniCOIL:通往可用稀疏神经检索的道路

Qdrant - Vector Database
Qdrant - Vector Database · 2025-05-12T21:00:00Z

本研究提出了FineCIR框架,旨在解决组合图像检索中因粗粒度修改文本导致的检索不准确问题。通过细粒度数据标注,FineCIR在FashionIQ和CIRR数据集上显著提高了检索精度,优于现有方法。

FineCIR: Explicit Parsing of Fine-Grained Modification Semantics for Composed Image Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本研究提出了一种基于大型语言模型的多智能体系统迭代检索方法,通过动态知识优化查询,避免偏见强化。该系统在复杂任务中表现出更高的检索精度和效率,优于传统方法。

Knowledge-Driven Iterative Retrieval for Multi-Agent Systems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z

本研究提出了HuixiangDou2框架,通过双层检索显著提升大型语言模型在特定领域和新兴主题查询中的检索精度与推理能力。

HuixiangDou2:一种稳健优化的图形RAG方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-09T00:00:00Z

本研究提出了一种新方法——强化信息检索(Reinforced-IR),旨在解决跨域信息检索的挑战。通过自我增强框架,显著提高了检索精度,实验结果表明其优于现有方法。

Reinforced Information Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z
检索增强生成(RAG)评估最佳实践:全面指南

本文介绍了评估检索增强生成(RAG)系统的准确性和质量的方法,包括检索精度、上下文相关性和响应准确性。常见问题有数据摄取不当、嵌入错误和检索过程未优化。推荐的评估框架包括Ragas、Quotient和Arize Phoenix。通过持续评估和调整,确保RAG系统适应变化并保持性能。

检索增强生成(RAG)评估最佳实践:全面指南

Qdrant - Vector Database
Qdrant - Vector Database · 2024-11-24T08:00:00Z

本研究评估了不同检索增强生成方法对检索精度和答案相似性的影响。研究发现HyDE和大型语言模型重排能提高检索精度,MMR和Cohere重排无优势,Multi-query方法表现不佳。句窗检索是最有效的方法,但答案相似性不稳定。研究证实文件摘要索引是有效的检索方法。欢迎学术界进一步探索RAG系统的研究。

通过排名模型提升问答文本检索:重标定、微调与重排器的部署

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-12T00:00:00Z

北京大学和南洋理工大学的研究团队提出了一种新的通用风格检索任务,通过构建多样化的查询图片数据集和即插即用的框架,解决了传统检索模型无法兼容不同类型查询向量的问题。实验证明该框架能够显著增强现有检索模型的泛化能力,并提升模型的检索精度。

搜索图片有新招了!北大提出图像检索新方法 | ECCV 2024

量子位
量子位 · 2024-08-22T08:40:44Z

该研究比较了双编码器与稀疏词袋模型和注意力神经网络的检索能力。研究发现双编码器在编码维数、金标和排名较低文件之间的边际以及文档长度方面存在限制。研究提出了一种结合了双编码器和注意力结构的简单神经模型,并探索了稀疏-密集混合模型以提高检索精度。这些模型在大规模检索中胜过替代方案。

可学习的后期交互的高效文档排序

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

本研究评估了不同检索增强生成方法对检索精度和答案相似性的影响。研究发现,Hypothetical Document Embedding (HyDE) 和大型语言模型重排能显著提高检索精度。Maximal Marginal Relevance (MMR) 和 Cohere 重排在基线 Naive RAG 系统上没有明显优势。句窗检索为最有效的检索精度方法。研究证实文件摘要索引作为一种有效的检索方法。

ARAGOG:高级 RAG 输出评分

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-01T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码