小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

该研究使用双编码器模型实现实体链接,通过在相同的向量空间中对实体和提及进行编码,并使用近似最近邻搜索检索候选实体。该方法在维基百科数据集上的实验中表现优于其他方法,并且可以快速检索候选者。无监督的负采矿算法在该任务中起到重要作用。

基于交叉编码器的自适应检索与可扩展索引的 k-NN 搜索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-06T00:00:00Z

该文介绍了使用双编码器模型实现实体链接的方法,通过在相同的密集向量空间中对实体和提及进行编码,并使用近似最近邻搜索检索候选实体。该方法优于离散别名表和BM25基线,并且可以快速检索候选者,并可以很好地推广到从Wikinews推导出的新数据集。同时,无监督的负采矿算法在这一任务中也发挥了重要作用。

重新审视稀疏检索用于少样本实体链接

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-19T00:00:00Z

该文介绍了使用双编码器模型实现实体链接的方法,通过在相同的密集向量空间中对实体和提及进行编码,并使用近似最近邻搜索检索候选实体。该方法通过使用维基百科中的锚文本链接训练双编码器,优于离散别名表和BM25基线,并可以快速检索候选者,并可以很好地推广到从Wikinews推导出的新数据集。同时,无监督的负采矿算法在这一任务中也发挥了重要作用。

AKEM: 使用集成模型将知识库与查询对齐的实体识别和链接

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-12T00:00:00Z
格雷格·理查森:pgvector v0.5.0:使用HNSW索引实现更快的语义搜索

Supabase Vector通过添加HNSW索引类型来提高速度。HNSW是一种用于高维空间的近似最近邻搜索算法,结合了分层和可导航小世界的概念。与IVF索引相比,HNSW具有更好的性能和准确性,并且可以在表创建后立即构建。IVFFlat索引在v0.5.0中也有改进,包括并行化和精度提升。根据内存限制和索引重建需求,可以选择使用HNSW或IVFFlat索引。

格雷格·理查森:pgvector v0.5.0:使用HNSW索引实现更快的语义搜索

Planet PostgreSQL
Planet PostgreSQL · 2023-09-06T00:00:00Z
Greg Richardson:pgvector v0.5.0:使用HNSW索引实现更快的语义搜索

Supabase Vector将使用pgvector v0.5.0,添加了HNSW索引类型,用于近似最近邻搜索。HNSW结合了分层和可导航小世界的概念,通过跳表和多维距离度量实现搜索。HNSW性能优于IVFFlat,随数据库大小扩展。建议减少嵌入式维度。

Greg Richardson:pgvector v0.5.0:使用HNSW索引实现更快的语义搜索

Planet PostgreSQL
Planet PostgreSQL · 2023-09-05T00:00:00Z
回顾 2022 年 — Elastic 年度回望

Elastic 7.x 系列引入近似最近邻搜索,提升矢量搜索实用性。Elastic Security for Cloud 扩展安全功能,获得“领导者”称号。可观测性方面推出零检测 Universal Profiling™ 和改进监测体验。未来,无状态 Elasticsearch 将成为下一代 Elastic SaaS 产品基础,提升运维和性能。

回顾 2022 年 — Elastic 年度回望

Elastic Blog
Elastic Blog · 2023-01-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码