小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种新方法,结合大型语言模型(LLM)和领域专家的输入,生成特定领域的基于文档查询(QBD)数据集。这种方法显著降低了人力成本,并提升了QBD搜索性能和检索模型的优化效果。

QBD排名数据生成:利用LLM重排序以减少人工成本生成定制排名数据集以改善基于文档查询的搜索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-07T00:00:00Z

本研究提出了一种受 $ ext{l}_0$ 启发的稀疏化方法,旨在提高稀疏检索模型在无推理场景下的效率。评估结果表明,该方法在 BEIR 基准测试中表现优异,与主流模型相当,揭示了检索效果与计算效率之间的权衡,具有实际应用价值。

探索无推理稀疏检索器的 $\ell_0$ 稀疏化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z

本研究探讨了利用大语言模型(LLMs)生成标注,以降低检索模型训练和评估中的人工成本。结果表明,基于LLMs的标注在跨任务迁移中表现优越,尤其在非领域设置下,其性能超过传统人类标注模型,展现出更好的通用性。

Leveraging Large Language Models for Utility-Centric Annotation: Reducing Manual Effort in Retrieval and RAG

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z

本研究提出了MomentSeeker基准,旨在解决长视频理解中的时刻检索问题,涵盖超过500秒的视频,评估多种检索模型的表现,揭示现有方法的局限性,并通过多模态大语言模型取得显著成果。

MomentSeeker:长视频时刻检索的综合基准与强基线

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究介绍了首个德国语方言检索数据集WikiDIR,指出传统词汇方法在高词汇变异情况下的不足,强调开发节省资源的方言特定检索模型的必要性,并证明文档翻译可以缩小方言差距。

跨方言信息检索:低资源和高变异语言的信息获取

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z

本研究提出了一种结合三种检索模型和重新排序器的系统,以解决RIRAG-2025任务中的监管问题。通过提取重要句子并优化答案,生成了更具可读性和连贯性的回答。

AUEB-阿基米德在RIRAG-2025:义务串联真的是你所需要的吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

近年来,长期记忆对话代理的兴趣增加,使用RAG语言模型快速发展。研究人员生成了一个新的数据集,并开发了一种新的检索模型,证明其在解决基于时间/事件的查询和模糊查询任务上比标准方法更有效。这个新数据集和更先进的RAG代理可以成为记忆增强对话代理的关键基准和垫脚石。

全能查询:上下文化捕获的多模态记忆以实现个人问答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-12T00:00:00Z
Jina ColBERT v2:用于嵌入和重排序的多语言后期交互检索器

Jina ColBERT v2是一种先进的检索模型,相比以前的版本,它提高了性能。它支持89种语言的多语言能力,并允许用户控制输出嵌入大小。该模型紧凑且优于基于BM25的检索。它还提供了Matryoshka表示学习,允许不同的输出向量大小。Jina ColBERT v2可以通过各种API访问,并集成到不同的框架中。它在精确性和效率之间提供了平衡,可能降低存储和计算成本。

Jina ColBERT v2:用于嵌入和重排序的多语言后期交互检索器

Jina AI
Jina AI · 2024-08-30T07:19:58Z
使用视觉语言模型进行 PDF 检索 [译]

构建检索增强生成(RAG)解决方案是热门话题,将大语言模型(LLM)与检索模型结合应用于专有知识数据库。ColPali是一种新颖的方法,将PDF页面截图转化为向量表示,无需复杂的预处理步骤。ColPali在视觉文档检索基准测试中表现出色,超过其他检索模型。与Vespa结合,可以构建强大的RAG管道,仅使用文档页面的视觉表示。

使用视觉语言模型进行 PDF 检索 [译]

宝玉的分享
宝玉的分享 · 2024-07-17T20:50:00Z

介绍了一个大规模的众包文字冒险游戏作为研究平台,用于研究基于场景的对话。代理可以感知、表情和行动,并与其他代理进行对话。通过训练生成模型和检索模型,模型能够使用潜在世界的状态来调整预测,更好地预测代理行为和对话。分析了成功落地所需的要素和与代理相关的因素。

对话基础:基础行为和基础单元的注释与分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-25T00:00:00Z

介绍了一个大规模的众包文字冒险游戏作为研究平台,用于研究基于场景的对话。通过训练生成模型和检索模型,模型能够根据潜在世界的状态来调整预测,从而更好地预测代理行为和对话。分析了成功落地所需的要素和与代理相关的因素。

DrawTalking: 通过草图和语言构建互动世界

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-11T00:00:00Z

该研究结合了大型语言模型的检索模型和嵌入式检索模型,解决了零样本检索问题。通过生成增强检索和检索增强生成两种范式,并使用新颖的循环公式,在零样本环境中改进检索和重写阶段,提高了系统召回率和精准度。

ARES:一种用于检索增强生成系统的自动化评估框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-16T00:00:00Z

本文介绍了一个大规模的法律案例检索数据集LeCaRDv2,解决了现有数据集中的三个问题,并提出了一个有效识别潜在候选项的候选集合策略。在该数据集上评估了多个检索模型,结果表明法律案例检索仍有很大的改进空间。

LeCaRDv2:一个大规模的中文法律案例检索数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-26T00:00:00Z

该文介绍了一种名为 Neural PG-RANK 的新型训练算法,通过实例化一个语言模型为 Plackett-Luce 排序策略,为检索模型的端到端训练提供了一种合理的方法,并有效地将训练目标与下游决策质量相统一。

语言模型的策略梯度训练方法用于排名

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-06T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码