小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
RAG中的分块:策略、权衡与常见错误

本文讨论了在检索增强生成(RAG)管道中,文档分块的重要性。分块策略影响检索精度、索引大小和查询延迟。常见的分块方法包括固定大小分块、递归分块和语义分块。选择合适的分块策略需考虑文档类型和查询模式。较小的分块适合精确检索,而较大的分块则有助于叙述性查询。

RAG中的分块:策略、权衡与常见错误

Redis Blog
Redis Blog · 2026-04-13T00:00:00Z
提升检索增强生成(RAG)准确性的10种技术

检索增强生成(RAG)通过在特定领域的验证上下文中提升大型语言模型(LLM)的输出准确性。建议从简单的RAG管道入手,逐步优化检索、模型专精和答案稳定性。采用混合搜索、调整HNSW索引和优化文档分块等技术,可以显著提高检索精度和生成质量。

提升检索增强生成(RAG)准确性的10种技术

Redis Blog
Redis Blog · 2026-02-25T00:00:00Z
Agent 教程笔记(Task03)

记忆与检索系统设计包括工作记忆、情景记忆、语义记忆和感知记忆,支持个性化服务。RAG系统通过外部知识库增强模型能力,结合多查询扩展和假设文档嵌入提高检索精度,形成完整闭环。

Agent 教程笔记(Task03)

程序员充电站
程序员充电站 · 2025-12-21T14:55:57Z

中国联通研究团队在AAAI 2026上发布了HiMo-CLIP模型,解决了长文本图像检索中的语义层级和单调性问题。该模型通过动态特征提取和对齐机制,显著提高了长短文本的检索精度,性能优于现有模型。

让大模型学会“高维找茬”,中国联通新研究解决长文本图像检索痛点|AAAI 2026 Oral

量子位
量子位 · 2025-12-01T08:49:46Z
StackAI通过LlamaCloud提升企业文档代理的高精度检索

StackAI通过LlamaCloud提升企业文档代理的检索精度,利用LlamaParse API快速处理复杂文档,动态调整解析质量,显著提高处理准确性和效率,增强客户信任。

StackAI通过LlamaCloud提升企业文档代理的高精度检索

Blog on LlamaIndex
Blog on LlamaIndex · 2025-08-20T00:00:00Z

语义分块RAG方法通过计算句子间的语义相似度进行智能分块,从而提高检索精度。该方法利用百分位数等技术识别语义断点,将文本划分为连贯的块,并支持多种断点检测方式。

RAG系列-语义分块RAG(Semantic Chunking RAG)

Ethan's Blog
Ethan's Blog · 2025-06-17T16:00:00Z

语义分块RAG方法通过计算句子间的语义相似度进行智能分块,提升检索精度。该方法利用百分位数等技术找到语义断点,将文本分割成连贯块,适用于长文档处理和复杂问答系统。

RAG系列-语义分块RAG(Semantic Chunking RAG)

Ethan's Blog
Ethan's Blog · 2025-06-17T16:00:00Z
miniCOIL:通往可用稀疏神经检索的道路

miniCOIL是一种轻量级的稀疏神经检索模型,旨在结合BM25的优点,克服传统稀疏检索的局限性。该模型通过语义理解提升检索精度,特别适用于文档搜索,测试结果显示其在多个领域略优于BM25,展现了稀疏神经检索的潜力。

miniCOIL:通往可用稀疏神经检索的道路

Qdrant - Vector Database
Qdrant - Vector Database · 2025-05-12T21:00:00Z

本研究提出了FineCIR框架,旨在解决组合图像检索中因粗粒度修改文本导致的检索不准确问题。通过细粒度数据标注,FineCIR在FashionIQ和CIRR数据集上显著提高了检索精度,优于现有方法。

FineCIR: Explicit Parsing of Fine-Grained Modification Semantics for Composed Image Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本研究提出了一种基于大型语言模型的多智能体系统迭代检索方法,通过动态知识优化查询,避免偏见强化。该系统在复杂任务中表现出更高的检索精度和效率,优于传统方法。

Knowledge-Driven Iterative Retrieval for Multi-Agent Systems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z

本研究提出了HuixiangDou2框架,通过双层检索显著提升大型语言模型在特定领域和新兴主题查询中的检索精度与推理能力。

HuixiangDou2:一种稳健优化的图形RAG方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-09T00:00:00Z

本研究提出了一种新方法——强化信息检索(Reinforced-IR),旨在解决跨域信息检索的挑战。通过自我增强框架,显著提高了检索精度,实验结果表明其优于现有方法。

Reinforced Information Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z
检索增强生成(RAG)评估最佳实践:全面指南

本文介绍了评估检索增强生成(RAG)系统的准确性和质量的方法,包括检索精度、上下文相关性和响应准确性。常见问题有数据摄取不当、嵌入错误和检索过程未优化。推荐的评估框架包括Ragas、Quotient和Arize Phoenix。通过持续评估和调整,确保RAG系统适应变化并保持性能。

检索增强生成(RAG)评估最佳实践:全面指南

Qdrant - Vector Database
Qdrant - Vector Database · 2024-11-24T08:00:00Z

北京大学和南洋理工大学的研究团队提出了一种新的通用风格检索任务,通过构建多样化的查询图片数据集和即插即用的框架,解决了传统检索模型无法兼容不同类型查询向量的问题。实验证明该框架能够显著增强现有检索模型的泛化能力,并提升模型的检索精度。

搜索图片有新招了!北大提出图像检索新方法 | ECCV 2024

量子位
量子位 · 2024-08-22T08:40:44Z

本文探讨了大型语言模型(LLMs)在信息检索和相关性判断中的应用,提出了多种新方法以提高检索精度和生成能力。研究表明,自动化相关判断和缺失信息识别能显著增强检索系统性能,并验证了新框架在多项任务中的优越性。

通过灵感哲学中的相关性迭代实用判断框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z
知识图谱在RAG中的应用探讨 - JadePeng

本文探讨了知识图谱(KG)在RAG流程中的应用,包括为查询添加上下文、构建缩略词词典和进行多跳推理等。KG有助于组织文档内容,提高检索的精度和效率。通过递归查询,KG能够持续优化问题,提供更准确的答案,尤其在医疗领域的应用中表现突出。

知识图谱在RAG中的应用探讨 - JadePeng

博客园 - JadePeng
博客园 - JadePeng · 2024-04-10T09:52:00Z
关于过滤向量搜索的所有信息:它的重要性及其背后的原理

过滤向量搜索在大规模数据检索中至关重要,显著提高检索精度。MyScale通过预过滤和列存储等技术,实现高效的过滤搜索,支持多用户系统。在金融分析等应用中,精度可从60%提升至90%。结合结构化数据与向量数据,MyScale为大规模LLM应用奠定了基础。

关于过滤向量搜索的所有信息:它的重要性及其背后的原理

MyScale Blog
MyScale Blog · 2024-02-13T05:00:00Z

本文介绍了相似性学习及其在机器学习中的应用,特别是使用Quaterion框架进行微调。Quaterion基于PyTorch Lightning,提供可训练模型、内置损失函数和数据加载器,简化了相似性学习的过程。通过斯坦福汽车数据集,展示了如何分开训练和测试集,以测试模型对新类别的识别能力。经过微调的模型在检索精度上显著提升。

微调相似汽车搜索

Qdrant - Vector Database
Qdrant - Vector Database · 2022-06-28T10:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码