小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
RAG指标:如何衡量和优化你的检索管道

用户询问重置密码时,聊天机器人能快速提供正确答案,但询问退款政策时却返回不相关信息。RAG指标用于识别问题,优化架构和度量标准。检索质量、生成准确性和系统可靠性是关键,选择合适的指标应基于架构设计,以确保在生产环境中平衡质量、成本和速度。

RAG指标:如何衡量和优化你的检索管道

Redis Blog
Redis Blog · 2026-03-03T00:00:00Z
RAG的全文搜索:精确层的向量搜索并不能可靠替代

向量搜索在人工智能中受到关注,但在检索增强生成(RAG)应用中,全文搜索提供更高精度。BM25算法通过词频、文档长度归一化和逆文档频率优化搜索结果。混合检索系统结合全文搜索与向量搜索,实现关键词精确匹配和语义回忆,提升检索质量。

RAG的全文搜索:精确层的向量搜索并不能可靠替代

Redis Blog
Redis Blog · 2026-02-23T00:00:00Z
如何为您的AI技术栈选择最佳向量数据库

每个AI项目都会面临并发用户和延迟峰值等挑战。选择向量数据库时,应关注性能、检索质量和操作复杂性。向量数据库通过存储高维向量嵌入来解决相似性搜索问题,适用于需要快速检索的场景。评估时需测试实际数据和查询模式,以确保满足需求。

如何为您的AI技术栈选择最佳向量数据库

Redis Blog
Redis Blog · 2026-01-20T00:00:00Z
从ts_rank到BM25:在Postgres中引入pg_textsearch:真正的BM25排名与混合检索

pg_textsearch是一个Postgres扩展,旨在满足现代AI应用的需求,结合BM25排名和简单事务处理,提升检索质量,适用于RAG系统和混合搜索,支持向量搜索与关键词匹配的结合。

从ts_rank到BM25:在Postgres中引入pg_textsearch:真正的BM25排名与混合检索

Timescale Blog
Timescale Blog · 2025-10-23T14:00:53Z
GitHub Copilot在代码查找方面变得更智能:深入了解我们的新嵌入模型

GitHub推出了新的Copilot嵌入模型,提升了VS Code中的代码搜索速度和准确性,检索质量提高了37.6%。该模型优化了内存使用,支持更快的响应,帮助开发者更有效地找到相关代码片段。

GitHub Copilot在代码查找方面变得更智能:深入了解我们的新嵌入模型

The GitHub Blog
The GitHub Blog · 2025-09-24T20:24:18Z
Fieldy AI如何通过Qdrant实现可靠的AI记忆

Fieldy AI迁移至Qdrant,构建了一个容错的AI记忆平台,实时记录和检索对话,支持多语言,增强用户信任。迁移后,系统稳定性和成本效益显著提升,未来将专注于提高检索质量。

Fieldy AI如何通过Qdrant实现可靠的AI记忆

Qdrant - Vector Database
Qdrant - Vector Database · 2025-09-04T00:00:00Z
推出voyage-3.5和voyage-3.5-lite:为新的检索前沿提供更高质量

新推出的voyage-3.5和voyage-3.5-lite嵌入模型在检索质量上优于前代产品,分别提高了2.66%和4.28%。这两款模型支持多维度嵌入,成本显著降低,分别比OpenAI-v3-large降低83%。它们在多个领域的评估中表现出色,提供更高的性价比。

推出voyage-3.5和voyage-3.5-lite:为新的检索前沿提供更高质量

MongoDB
MongoDB · 2025-05-20T14:00:00Z
voyage-3.5和voyage-3.5-lite:为新的检索前沿提供更高质量

新推出的voyage-3.5和voyage-3.5-lite嵌入模型在检索质量上优于前代产品,成本更低,支持多维嵌入,向量数据库成本减少83%,在多个领域表现超越OpenAI-v3-large。

voyage-3.5和voyage-3.5-lite:为新的检索前沿提供更高质量

Voyage AI
Voyage AI · 2025-05-20T13:05:00Z
从简单检索到句子窗口检索:RAG系统中的演变

RAG系统依赖于良好的数据结构和设计选择,检索质量、嵌入模型、分块策略和提示设计等因素影响其效果。传统方法可能导致上下文丢失和信息过载,而句子窗口检索通过关注单个句子及其上下文,提高了在法律和医疗等高精度领域的准确性。

从简单检索到句子窗口检索:RAG系统中的演变

DEV Community
DEV Community · 2025-05-11T17:54:06Z
voyage-3-large:新一代通用嵌入模型的最先进技术

voyage-3-large是一种新型多语言嵌入模型,在100个数据集的八个领域中表现优异,超越OpenAI-v3-large和Cohere-v3-English。该模型通过Matryoshka学习和量化训练,支持小维度和低存储成本,检索质量几乎不受影响,提供更高的灵活性和效率。

voyage-3-large:新一代通用嵌入模型的最先进技术

Voyage AI
Voyage AI · 2025-01-07T19:16:24Z
voyage-3与voyage-3-lite:新一代小巧而强大的通用嵌入模型

我们推出了voyage-3和voyage-3-lite嵌入模型,提升了检索质量并降低了成本。voyage-3在多个领域的表现超越OpenAI v3 large 7.55%,成本降低2.2倍;voyage-3-lite在检索准确性上比OpenAI v3 large高出3.82%,成本降低6倍。两者支持32K-token上下文长度,适合多种应用场景。

voyage-3与voyage-3-lite:新一代小巧而强大的通用嵌入模型

Voyage AI
Voyage AI · 2024-09-19T05:26:10Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码