小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

该研究使用双编码器模型实现实体链接,通过在相同的向量空间中对实体和提及进行编码,并使用近似最近邻搜索检索候选实体。该方法在维基百科数据集上的实验中表现优于其他方法,并且可以快速检索候选者。无监督的负采矿算法在该任务中起到重要作用。

基于交叉编码器的自适应检索与可扩展索引的 k-NN 搜索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-06T00:00:00Z

本文介绍了一种通过多阶段训练扩大双编码器模型规模的方法,解决了双编码器在不同域上的推广问题。该方法在域外泛化和检索性能方面取得了显著提高,优于现有的检索模型。消融研究还发现该方法在数据效率方面非常高效。

回归基础:提升密集编码器领域外检索的简单方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-16T00:00:00Z

该文介绍了使用双编码器模型实现实体链接的方法,通过在相同的密集向量空间中对实体和提及进行编码,并使用近似最近邻搜索检索候选实体。该方法优于离散别名表和BM25基线,并且可以快速检索候选者,并可以很好地推广到从Wikinews推导出的新数据集。同时,无监督的负采矿算法在这一任务中也发挥了重要作用。

重新审视稀疏检索用于少样本实体链接

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-19T00:00:00Z

本文介绍了GTR模型,它是一种双编码器模型,通过多阶段训练并扩大模型规模,在保持瓶颈嵌入大小不变的情况下,成功挑战了双编码器无法推广到其他域的观念。GTR在域外泛化方面表现出显著的检索性能提高,并且在BEIR数据集上优于现有的稀疏和密集的检索模型。消融研究表明,GTR在数据效率方面非常高效,只需要MS Marco 10%的监督数据即可实现最佳的跨域检索性能。

双编码器在极端多标签分类中的效果

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-16T00:00:00Z

该文介绍了使用双编码器模型实现实体链接的方法,通过在相同的密集向量空间中对实体和提及进行编码,并使用近似最近邻搜索检索候选实体。该方法通过使用维基百科中的锚文本链接训练双编码器,优于离散别名表和BM25基线,并可以快速检索候选者,并可以很好地推广到从Wikinews推导出的新数据集。同时,无监督的负采矿算法在这一任务中也发挥了重要作用。

AKEM: 使用集成模型将知识库与查询对齐的实体识别和链接

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-12T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码