小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
RAG中的分块:策略、权衡与常见错误

本文讨论了在检索增强生成(RAG)管道中,文档分块的重要性。分块策略影响检索精度、索引大小和查询延迟。常见的分块方法包括固定大小分块、递归分块和语义分块。选择合适的分块策略需考虑文档类型和查询模式。较小的分块适合精确检索,而较大的分块则有助于叙述性查询。

RAG中的分块:策略、权衡与常见错误

Redis Blog
Redis Blog · 2026-04-13T00:00:00Z

在Cache Lab中,任务是优化32x32、64x64和61x67矩阵的转置,旨在减少缓存未命中。通过矩阵分块和循环展开技术,针对不同矩阵大小采用不同优化策略,以提高性能并降低缓存未命中次数。优化不仅依赖数学,还需理解硬件特性。

CSAPP缓存实验II:优化矩阵转置

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-05T00:00:00Z
戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

本文介绍如何使用pgEdge Vectorizer将文档分块并生成向量嵌入,以实现基于语义的搜索。通过将文档拆分为小块,系统能够更精确地检索相关内容。pgEdge Vectorizer作为PostgreSQL扩展,自动处理文档更新和嵌入生成,简化管理流程。

戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

Planet PostgreSQL
Planet PostgreSQL · 2025-12-09T06:30:44Z
RAG 分块策略:从原理到实战优化,喂饭级教程不允许你踩坑

本文探讨了检索增强生成(RAG)中分块策略的重要性。分块是将大型文档分割成小片段以优化信息检索。主要分块策略包括固定大小、语义、递归和基于文档等,每种策略各有优缺点。选择合适的分块策略需考虑文档类型和任务需求,建议从512个tokens和10-15%的重叠率开始,以提高检索效果和信息组织性。

RAG 分块策略:从原理到实战优化,喂饭级教程不允许你踩坑

京东科技开发者
京东科技开发者 · 2025-11-26T09:05:01Z
RAG 分块策略:从原理到实战优化,喂饭级教程不允许你踩坑

本文探讨了在检索增强生成(RAG)中分块策略的重要性。分块是将大型文档分割成小片段以提高信息检索效率。主要分块策略包括固定大小分块、语义分块、递归分块和基于文档的分块。每种策略各有优缺点,选择合适的方法对提升RAG性能至关重要。建议从512个tokens和10-15%的重叠率开始,结合递归和语义分块进行优化。

RAG 分块策略:从原理到实战优化,喂饭级教程不允许你踩坑

京东科技开发者
京东科技开发者 · 2025-11-21T10:09:06Z
构建更优秀的语言模型应用的关键分块技术

在构建检索增强生成(RAG)应用时,文档分块至关重要,影响信息检索和生成的准确性。常见的分块策略有固定大小、递归、语义和文档基础等。选择合适的分块方法需考虑文档特性和检索需求,以提升系统性能。

构建更优秀的语言模型应用的关键分块技术

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-06T11:00:54Z

Tiler是CuTe布局代数中的关键概念,支持分块数据访问。CuTe逻辑坐标定义数据位置,布局决定存储方式。通过CuTe的组合、补充和逻辑除法,可以灵活创建数据访问模式,从而优化CUDA加速计算中的数据访问效率。

CuTe 分块器

Lei Mao's Log Book
Lei Mao's Log Book · 2025-09-15T07:00:00Z
渗透测试 | 利用HTTP分块编码机制进行WAF绕过

文章讨论了应用验证和用户信息请求,涉及应用标识、用户ID及请求参数等数据。

渗透测试 | 利用HTTP分块编码机制进行WAF绕过

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-08-15T01:57:10Z

本文介绍了physical intelligence公司推出的实时动作分块技术,旨在提升视觉-语言-动作模型(VLA)的实时控制能力。该技术通过异步机制和修复方法,解决了模型推理延迟和动作不连贯的问题,使机器人能够更精确地执行复杂任务。

实时动作分块RTC——为解决高延迟,让π0.5也可以点燃火柴、插入网线:执行当前动作分块时生成下一个分块,且已执行的冻结 未执行的则补全

结构之法 算法之道
结构之法 算法之道 · 2025-07-15T08:43:07Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

用动作分块突破RL极限,伯克利引入模仿学习,超越离线/在线SOTA

机器之心
机器之心 · 2025-07-14T05:23:16Z
Vue Markdown 渲染优化实战(上):从暴力刷新、分块更新到 Morphdom 的华丽变身

本文探讨了在 Vue 中实现实时 Markdown 渲染的方案,采用 markdown-it 库和分块更新技术,解决了性能和用户状态丢失的问题。最终引入 morphdom 库以实现精准更新,提升渲染效率。下一篇将讨论更优雅的解决方案。

Vue Markdown 渲染优化实战(上):从暴力刷新、分块更新到 Morphdom 的华丽变身

竹林里有冰的博客
竹林里有冰的博客 · 2025-07-12T12:48:56Z
LLM分块:如何在大规模中提高检索效率与准确性

LLM分块技术通过将大数据拆分为小块,提高模型处理效率。有效的分块策略(如固定长度、语义分块和混合方法)能提升准确性和相关性,避免信息混淆。Redis支持高效分块,优化检索速度和上下文保留,适用于对准确性要求高的应用,如对话AI和语义搜索。

LLM分块:如何在大规模中提高检索效率与准确性

Redis Blog
Redis Blog · 2025-06-20T00:00:00Z

本研究提出了HOPE指标,分析文档分块对检索增强生成系统的影响。结果表明,该指标与RAG性能显著相关,为优化分块策略提供了新见解。

新的HOPE:领域无关的文本分块自动评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-04T00:00:00Z
通过智能分块策略提升增强检索生成(RAG)性能

本文讨论了增强检索生成(RAG)如何通过外部知识源提升大型语言模型(LLM)的响应准确性。RAG系统依赖向量数据库,涉及内容分块、向量化和索引等步骤。分块在数据检索中至关重要,优化了存储和处理效率。文章还分析了常见的分块策略及其对检索性能的影响。

通过智能分块策略提升增强检索生成(RAG)性能

DEV Community
DEV Community · 2025-04-16T13:26:47Z

2025年3月26日,七月在线升级为具身智能场景落地与定制开发商,推出标准化软硬件产品,简化复现过程。研究者提出OpenVLA-OFT,通过并行解码、动作分块和L1回归优化,提升推理效率和任务性能,成功率达到97.1%,加速动作生成。

OpenVLA-OFT——微调VLA时加快推理的三大关键设计:支持动作分块的并行解码、连续动作表示以及L1回归(含输入灵活化及对指令遵循的加强)

结构之法 算法之道
结构之法 算法之道 · 2025-04-04T14:35:18Z
深入探讨 - 分块传输编码的工作原理

分块传输编码是HTTP/1.1的重要特性,允许服务器逐步发送数据而无需知道总大小,适用于流媒体API和动态响应。每个数据块前有字节大小,客户端通过接收零长度块判断响应结束。HTTP/2及以上版本不再使用分块编码,而是采用更高效的二进制框架。这一理解有助于构建更好的流媒体API。

深入探讨 - 分块传输编码的工作原理

DEV Community
DEV Community · 2025-04-04T05:51:00Z

本研究提出了Bi-LAT,一个结合双边控制与自然语言处理的模仿学习框架,旨在实现机器人操作中的精确力调节。该方法通过多模态变换器模型编码人类指令,有效区分真实任务中的微妙力需求。

Bi-LAT:基于双边控制的模仿学习,通过自然语言和动作分块与变换器结合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究针对如何高效、准确地将大语言模型(LLMs)适应于专业科学领域(如材料科学)这一挑战进行了探讨,提出了一种结合结构化模型压缩和科学微调的两阶段框架。该框架通过局部低秩矩阵块的非周期性镶嵌与分块问答微调策略,实现了在数据稀缺条件下对LLMs的精确专业化,具有重要的应用前景。

佩恩罗斯镶嵌低秩压缩与分块问答微调:针对特定领域大语言模型适应性的通用框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-28T00:00:00Z
React 水合减慢了您的应用程序?看看浏览器调度 API 如何通过 scheduler.postTask() 和 yield() 提升性能,将 INP 从 24179 秒减少到 62 毫秒,延迟 3 秒——接下来进行分块!探索代码和 React 19 的预告。解决重组件问题。深入了解并发表评论

抱歉,您提供的文本没有具体的文章内容。请提供文章内容,我将为您进行总结。

React 水合减慢了您的应用程序?看看浏览器调度 API 如何通过 scheduler.postTask() 和 yield() 提升性能,将 INP 从 24179 秒减少到 62 毫秒,延迟 3 秒——接下来进行分块!探索代码和 React 19 的预告。解决重组件问题。深入了解并发表评论

DEV Community
DEV Community · 2025-03-08T12:55:03Z
使用OpenAI模型生成嵌入的最佳文本分块方法

在使用OpenAI嵌入模型时,文本分块是关键步骤,确保文本在令牌限制内并保留上下文。最佳实践包括基于令牌的分块、设置合适的块大小、添加重叠和使用逻辑分隔符。通过TypeScript实现分块和嵌入生成可提高处理效率和嵌入质量。

使用OpenAI模型生成嵌入的最佳文本分块方法

DEV Community
DEV Community · 2025-02-02T01:56:49Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码