小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
在增强检索生成(RAG)语义缓存中减少假阳性:银行案例研究

语义缓存是一种通过存储查询和响应的向量嵌入来增强检索的技术。本文记录了从失败到成功的过程,测试了七种双编码器模型,并优化了缓存设计,显著降低了错误率。最终,系统的假阳性率从99%降至3.8%,证明了缓存设计的重要性。

在增强检索生成(RAG)语义缓存中减少假阳性:银行案例研究

InfoQ
InfoQ · 2025-11-14T09:00:00Z
谷歌推出语音到检索(S2R)技术,无需先将语音转为文本即可检索信息

谷歌通过语音转检索(S2R)技术实现了语音搜索的突破,直接将语音查询映射为嵌入向量,避免转录错误。S2R采用双编码器架构,优化检索意图,提升搜索质量。谷歌已将该技术投入生产,并开源相关数据集以支持社区发展。

谷歌推出语音到检索(S2R)技术,无需先将语音转为文本即可检索信息

实时互动网
实时互动网 · 2025-10-13T02:35:18Z
通过Mobile-VideoGPT的创新框架解锁实时视频分析!

Mobile-VideoGPT是一种创新的实时视频分析框架,采用双编码器架构,能够高效处理视频数据,广泛应用于安全监控、医疗和娱乐等领域,提供即时洞察和决策支持。

通过Mobile-VideoGPT的创新框架解锁实时视频分析!

DEV Community
DEV Community · 2025-03-29T08:06:08Z

该研究提出上下文文档嵌入,通过双编码器架构捕捉文档的语义和上下文信息,提升文本分析效果。双编码器分别处理文档内容和上下文信息,利用对比损失函数优化,生成更准确的文档表示。实验显示,该方法在文本检索和分类任务中优于传统方法,但对显式上下文元数据的依赖可能限制应用,未来可探索隐式方法增强鲁棒性。

通过上下文文档嵌入捕捉语义和上下文以提升文本分析

DEV Community
DEV Community · 2024-10-06T06:52:17Z

本研究提出了一种新的文档嵌入方法,结合文档及其邻近文档的上下文,通过对比学习和新架构提升检索效果。在多个场景中优于现有双编码器,尤其在领域外表现突出,并在MTEB基准测试中取得了领先结果。

上下文文档嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

研究介绍了STREAMINGIR基准,用于评估检索方法在动态语料库中的泛化能力。比较了双编码器和生成式检索的性能和效率。结果显示,生成式检索在不同监督下表现不同,但通过参数优化可提升性能,与双编码器竞争。

动态数据集中的递归抽象处理用于检索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

检测任务导向对话中的超范围用户话语很重要。我们提出了DETER框架,使用双编码器生成用户话语嵌入,并通过神经网络进行分类。DETER结合自我监督生成异常值和开放域数据集短语,确保全面训练。基于阈值的重新分类机制细化预测。在多个数据集上,DETER显著提高了已知和未知意图的F1分数。

在大型语言模型时代的意图检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

该研究提出了UniDEC框架,通过多类损失统一训练双编码器和分类器,解决极端多标签分类问题。采用Pick-Some-Label方法,UniDEC在单GPU上实现了与多GPU方法相当的先进结果,并具备大规模数据集的可扩展性。

ASTRA:基于精确可扩展的近似最近邻算法训练极端分类器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本研究提出了一种基于语言的搜索方法,通过双编码器和跨注意力的视觉文本变压器相结合,提高了图像和视频数据集的检索准确性和可扩展性。该方法在Flickr30K图像数据集和VATEX视频数据集上进行了验证。

T2VIndexer:一种高效文本-视频检索的生成视频索引器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z
延迟交互模型,为什么是下一代RAG的标配?

AIxiv专栏介绍了排序模型中的双编码器和交叉编码器架构,以及以ColBERT为代表的延迟交互模型。ColBERT采用双编码器策略,提供高效的排序性能和精准的搜索排序结果。Infinity数据库提供了端到端的ColBERT方案,通过Tensor数据类型和Tensor Index技术优化计算性能。评测结果表明,ColBERT作为Reranker能够显著提升搜索结果质量。ColBERT及其延迟交互模型在RAG场景具有应用价值。

延迟交互模型,为什么是下一代RAG的标配?

机器之心
机器之心 · 2024-08-05T06:20:39Z

该研究比较了双编码器与稀疏词袋模型和注意力神经网络的检索能力。研究发现双编码器在编码维数、金标和排名较低文件之间的边际以及文档长度方面存在限制。研究提出了一种结合了双编码器和注意力结构的简单神经模型,并探索了稀疏-密集混合模型以提高检索精度。这些模型在大规模检索中胜过替代方案。

可学习的后期交互的高效文档排序

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

本文比较了双编码器和交叉编码器的差异,双编码器适合搜索,速度快且可扩展性强,交叉编码器适合分类和高精度排名,更准确。双编码器独立编码每个句子,将输入文本编码为固定长度向量,而交叉编码器同时对两个句子进行编码,能捕获句子之间的关系。在实践中,可以先使用双编码器减少候选数量,再使用交叉编码器获取最终结果。交叉编码器可用于语义相似性任务。通过两阶段检索和重新排序系统,可以在实践中使用双编码器和交叉编码器。

什么是句子嵌入、交叉编码器和重新排名

极道
极道 · 2024-01-21T22:31:00Z

本研究使用双编码器和跨注意力的视觉文本变压器方法进行基于语言的搜索,提高了检索准确性和可扩展性。在Flickr30K图像数据集和VATEX视频数据集上进行了验证。

文本 - 视频检索中的单查询后处理的 Sinkhorn 变换

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-14T00:00:00Z

该研究提出了一种新的方法,使用双编码器对比有序学习框架,将腹主动脉钙化量化为有序回归问题,并预测未来心血管事件的风险。在两个临床数据集上评估,具有高灵敏度和高准确性。

常规血管造影过程中腹主动脉 CT 密度的造影剂诱导决定性成分:概念验证研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-31T00:00:00Z

该文介绍了一种新的多语言实体链接公式,使用面向语言不可知的知识库解析语言特定的提及。作者训练了一个双编码器,以获得单个实体检索模型,覆盖了100多种语言和2000万个实体。该模型在跨语言链接任务中表现优异,但仍面临着罕见实体和低资源语言的挑战。作者提出了一个新的大型多语言数据集Mewsli-9,以帮助增强模型和训练。

DBLPLink:DBLP 学术知识图谱的实体链接器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码