小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
层次可导航小世界(HNSW)算法如何提升搜索效率

六度分隔理论表明人与人之间的社交联系紧密。HNSW是一种高效的近似最近邻算法,适用于高维数据搜索,结合了可导航的小世界和层次结构,提供快速搜索,广泛应用于图像识别、自然语言处理和推荐引擎。尽管HNSW在性能和实用性上优于其他算法,但也面临高内存消耗和构建开销的挑战。

层次可导航小世界(HNSW)算法如何提升搜索效率

Redis Blog
Redis Blog · 2025-06-10T00:00:00Z

本研究解决了HNSW算法在近似最近邻搜索中的局部最优和群体断连问题,以及在高维数据集中未能实现对数复杂度的问题。提出的双分支HNSW结构结合LID驱动的插入机制和桥接技术,有效提升了算法的准确性和速度,实验结果显示在自然语言处理任务中召回率提高了18\%,计算机视觉任务中提高了30\%,同时构建时间减少了20\%。

具有跳跃桥和基于LID优化的双分支HNSW方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

HNSW算法在小型数据集上表现良好,但在大规模向量相似性搜索中存在内存依赖和性能下降的问题。相比之下,IVF算法通过减少距离计算和优化量化技术,提供了更高效的解决方案,特别适合大规模数据集,因其简洁性和可扩展性而更具实用性。

为什么 HNSW 不是最终的答案

高策
高策 · 2024-12-24T15:00:00Z
在PostgreSQL中利用HNSW索引增强基于RAG的生成式AI应用

在生成式AI领域,检索增强生成(RAG)模型结合大型语言模型与外部知识库。随着知识库的扩大,检索效率变得至关重要。分层可导航小世界(HNSW)索引通过优化相似性搜索,显著提升RAG应用性能。实验显示,使用HNSW索引后,查询时间从18.3秒降至0.62秒,提升约30倍。

在PostgreSQL中利用HNSW索引增强基于RAG的生成式AI应用

DEV Community
DEV Community · 2024-11-15T11:05:03Z

该研究比较了HNSW、Flat和倒排索引三种常见的检索方法,分析了它们在性能、内存使用和索引构建方面的权衡,并提供了选择每种方法的指导。HNSW适用于高维数据和快速近似搜索,Flat适用于较小的数据集或内存受限的应用,倒排索引适用于大型文本语料库的精确关键词检索。该论文为开发人员和研究人员提供了有价值的操作建议。

构建搜索或推荐系统时,明智选择检索器:HNSW vs. Flat vs. 倒排索引

DEV Community
DEV Community · 2024-09-12T08:33:06Z
向量数据库基础:HNSW

这篇文章介绍了Pgvector和HNSW索引的概念和使用方法。Pgvector是PostgreSQL的扩展,用于在数据库中存储和检索向量数据。HNSW索引是一种用于高维向量数据的快速近邻搜索方法,通过构建多层图结构来实现。与传统的图索引方法相比,HNSW索引具有更高的效率和可扩展性。文章还介绍了如何在SQL和Python环境中使用Pgvector和HNSW索引。

向量数据库基础:HNSW

Timescale Blog
Timescale Blog · 2024-08-13T15:10:35Z

HNSW算法是一种解决高维向量数据快速检索问题的方法,通过构建多层次的图结构和小世界网络特性实现快速、精确的检索。它在推荐系统、图像检索和自然语言处理等领域广泛应用。未来,向量数据库技术可能会发展出更高效的压缩和索引技术,更好的动态更新支持,以及与深度学习模型更紧密集成的优化变体。

向量数据库学习-介绍一下HNSW算法

Nicksxs's Blog
Nicksxs's Blog · 2024-06-23T14:50:50Z
塞马布·塔里克:在pgvector中使用并行索引构建将HNSW构建速度提高80%

随着pgvector 0.6的发布,HNSW的索引构建能力有了重大更新,即并行索引构建。并行索引构建利用并行处理来加快索引创建速度,可以更好地利用系统资源。在基准测试中,显示并行索引构建比传统的单线程索引构建快80%。通过设置max_parallel_maintenance_workers参数,可以控制最大并行工作者数量,平衡查询和维护任务的工作负载。

塞马布·塔里克:在pgvector中使用并行索引构建将HNSW构建速度提高80%

Planet PostgreSQL
Planet PostgreSQL · 2024-03-28T18:13:41Z
Ricardo Zavaleta:在Postgres中使用pgvector的向量索引:IVFFlat与HNSW

本文介绍了使用索引加速数据库中查找特定值的过程,并探讨了向量数据库中使用向量索引的优势和权衡。Pgvector是一种开源的Postgres扩展,用于相似性搜索,提供了IVFFlat和HNSW两种类型的索引。根据实验结果,IVFFlat在索引构建时间和大小方面表现更好,而HNSW在速度方面表现更好。根据需求和应用场景的不同,可以选择适合的索引类型。

Ricardo Zavaleta:在Postgres中使用pgvector的向量索引:IVFFlat与HNSW

Planet PostgreSQL
Planet PostgreSQL · 2023-11-14T00:00:00Z

Increase performance in pgvector using HNSW indexes

pgvector v0.5.0: Faster semantic search with HNSW indexes

Blog - Supabase
Blog - Supabase · 2023-09-06T07:00:00Z
格雷格·理查森:pgvector v0.5.0:使用HNSW索引实现更快的语义搜索

Supabase Vector通过添加HNSW索引类型来提高速度。HNSW是一种用于高维空间的近似最近邻搜索算法,结合了分层和可导航小世界的概念。与IVF索引相比,HNSW具有更好的性能和准确性,并且可以在表创建后立即构建。IVFFlat索引在v0.5.0中也有改进,包括并行化和精度提升。根据内存限制和索引重建需求,可以选择使用HNSW或IVFFlat索引。

格雷格·理查森:pgvector v0.5.0:使用HNSW索引实现更快的语义搜索

Planet PostgreSQL
Planet PostgreSQL · 2023-09-06T00:00:00Z
Greg Richardson:pgvector v0.5.0:使用HNSW索引实现更快的语义搜索

Supabase Vector将使用pgvector v0.5.0,添加了HNSW索引类型,用于近似最近邻搜索。HNSW结合了分层和可导航小世界的概念,通过跳表和多维距离度量实现搜索。HNSW性能优于IVFFlat,随数据库大小扩展。建议减少嵌入式维度。

Greg Richardson:pgvector v0.5.0:使用HNSW索引实现更快的语义搜索

Planet PostgreSQL
Planet PostgreSQL · 2023-09-05T00:00:00Z
克里斯托弗·温斯莱特:Postgres和pgvector中的HNSW索引

Postgres的pgvector扩展添加了HNSW作为新的向量数据索引类型,允许进行近似最近邻查询。HNSW是一种使用图拓扑结构来寻找最近邻的分层可导航小世界算法。HNSW索引查询速度比基于列表的索引更快,但构建时间和内存消耗更长。m和ef_construction的值影响索引的构建时间和性能。HNSW索引对于扩展向量数据和提高并发性非常有用。

克里斯托弗·温斯莱特:Postgres和pgvector中的HNSW索引

Planet PostgreSQL
Planet PostgreSQL · 2023-09-01T13:00:00Z

本文测试了pgvector的HNSW实现在性能和召回率方面的结果,并与pg_embedding的HNSW实现进行了比较。测试结果显示,pgvector的HNSW实现在大多数情况下表现更好,具有更好的性能和召回率。文章还提到了索引构建时间和索引大小等方面的考虑因素。总的来说,pgvector的HNSW实现是存储和搜索向量数据的重要工具。

乔纳森·卡茨:初探pgvector中HNSW的性能

Planet PostgreSQL
Planet PostgreSQL · 2023-08-10T00:00:00Z

If you need to find some similar objects in vector space, provided e.g. by embeddings or matching NN, you can choose among a variety of libraries: Annoy, FAISS or NMSLib. All of them will give you...

Filtrable HNSW

Qdrant - Vector Database
Qdrant - Vector Database · 2019-11-24T19:44:08Z

If you need to find some similar objects in vector space, provided e.g. by embeddings or matching NN, you can choose among a variety of libraries: Annoy, FAISS or NMSLib. All of them will give you...

Filterable HNSW

Qdrant - Vector Database
Qdrant - Vector Database · 2019-11-24T19:44:08Z

Day 2 HNSW Indexing Fundamentals At this point, you’ve learned how vector search retrieves the nearest vectors to a query using cosine similarity, dot product, or Euclidean distance. How does...

HNSW Indexing Fundamentals

Qdrant - Vector Database
Qdrant - Vector Database · 1970-01-01T08:00:00Z

Day 2 Demo: HNSW Performance Tuning Learn how to improve vector search speed with HNSW tuning and payload indexing on a real 100K dataset. Follow along in Colab: What You’ll Do Yesterday you...

Demo: HNSW Performance Tuning

Qdrant - Vector Database
Qdrant - Vector Database · 1970-01-01T08:00:00Z

Day 2 Project: HNSW Performance Benchmarking Now that you’ve seen how HNSW parameters and payload indexes affect performance with the DBpedia dataset, it’s time to optimize for your own domain...

Project: HNSW Performance Benchmarking

Qdrant - Vector Database
Qdrant - Vector Database · 1970-01-01T08:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码