小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了构建向量搜索引擎的过程,包括整体架构、距离函数、HNSW索引、乘积量化、WAL和mmap等关键技术。向量搜索引擎分为API层、索引层和存储层,采用HNSW作为索引,使用WAL实现崩溃恢复,并通过mmap优化内存管理。文章还探讨了距离计算加速方法和元数据过滤策略,并提供了一个用Go实现的简化版本。

从零实现一个向量搜索引擎

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-06-02T00:00:00Z
Postgres开发者的向量索引权衡指南

本文讨论了Postgres中的向量搜索及其索引设计,强调在不同工作负载下选择合适索引的重要性。介绍了HNSW、IVFFlat和DiskANN等算法,并分析了它们在内存、召回率和写入成本等方面的权衡。建议根据实际数据和查询模式进行基准测试,以优化检索质量和性能。

Postgres开发者的向量索引权衡指南

Timescale Blog
Timescale Blog · 2026-05-26T14:23:55Z
CockroachDB如何在大规模下构建向量索引

CockroachDB团队开发了C-SPANN向量索引,以满足分布式数据库的需求。该索引将向量视为普通表数据,支持实时更新和分片,避免了中心协调和大内存缓存的依赖。C-SPANN结合K均值树结构和增量更新技术,实现高效的近似最近邻搜索,适用于需要向量与事务数据共存的多租户应用。

CockroachDB如何在大规模下构建向量索引

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-05-25T15:30:38Z
相似不等于相关:两种编码器破解向量数据库的真正短板

向量搜索并不等于找到正确答案。现代搜索系统结合双编码器和交叉编码器,前者用于快速召回候选文档,后者用于精确排序。有效的搜索系统需兼顾速度与准确性,以提升搜索质量。

相似不等于相关:两种编码器破解向量数据库的真正短板

极道
极道 · 2026-05-25T02:14:00Z
JEP 目标为 JDK 27:537:向量 API(第十二个孵化阶段)

JEP 537 旨在 JDK 27,介绍了第十二个孵化阶段的向量 API,增强了 Java 的性能和功能。

JEP 目标为 JDK 27:537:向量 API(第十二个孵化阶段)

insidejava
insidejava · 2026-05-25T00:00:00Z
针对JDK 27的JEP:537:向量API(第十二次孵化)

Oracle Java团队分享了JDK 27的最新动态,重点介绍了第537号JEP:向量API(第十二次孵化)。

针对JDK 27的JEP:537:向量API(第十二次孵化)

insidejava
insidejava · 2026-05-25T00:00:00Z
在PostgreSQL中使用pgvector构建向量相似性搜索

本文介绍了如何在PostgreSQL中使用pgvector扩展进行向量相似性搜索。pgvector支持将向量嵌入与关系数据存储,提供多种距离度量和索引类型。通过示例,展示了创建表、插入数据和执行相似性查询的方法,并结合SQL过滤器提升搜索效果。选择合适的嵌入模型和距离度量至关重要。

在PostgreSQL中使用pgvector构建向量相似性搜索

MachineLearningMastery.com
MachineLearningMastery.com · 2026-05-18T13:45:55Z
AI 开发狂飙!.NET 11 Preview 4 原生集成向量搜索 + MCP 模板,EF Core 直接对标 RAG 应用

微软在.NET 11 Preview 4中强调向量搜索是AI开发的核心,结合EF Core和MCP Server模板,提升了语义检索和API调用的标准化。EF Core支持向量搜索,简化了AI应用开发,MCP为AI模型提供统一的工具调用接口。这些进展使.NET开发者能够更高效地构建AI应用。

AI 开发狂飙!.NET 11 Preview 4 原生集成向量搜索 + MCP 模板,EF Core 直接对标 RAG 应用

dotNET跨平台
dotNET跨平台 · 2026-05-17T00:01:10Z

SharpVector 是一个轻量级的 .NET 向量数据库,专为语义搜索和 RAG 应用设计。它支持内存级文本向量存储与相似度搜索,易于集成,适合本地或嵌入式场景。该项目基于 .NET 8 开发,功能灵活,支持多种向量生成器,适合快速构建 AI 应用。

强烈推荐一个轻量可嵌入的 .NET 向量数据库:SharpVector

dotNET跨平台
dotNET跨平台 · 2026-05-08T00:02:16Z

文章讨论了互联网路由的三种主要算法:距离向量、链路状态和路径向量。动态路由协议在变化的网络中寻找最佳路径。距离向量算法(如RIP)简单但存在计数到无穷的问题;链路状态算法(如OSPF)通过全局视图实现快速收敛;路径向量算法(如BGP)则基于策略进行域间路由。每种算法在正确性、收敛速度和可扩展性方面各有优缺点。

路由算法:距离向量 vs 链路状态 vs 路径向量

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-06T00:00:00Z
向量为我们提供了人工智能搜索,张量将使其更智能

文章讨论了向量和张量在人工智能中的重要性。向量将信息转化为数字形式,便于AI处理,但一维特性限制了信息表达。张量具有多维特性,能提供更多上下文,提升搜索能力和排名精度。随着数据量增加,企业需要更强大的工具来优化AI工作。

向量为我们提供了人工智能搜索,张量将使其更智能

The New Stack
The New Stack · 2026-04-24T13:42:03Z

本文探讨了RAG(检索增强生成)中的存储与检索层,重点介绍向量索引算法的选择和量化方法,以及2024-2026年工业界的趋势。文章分为四部分:算法底层、产品选型、工程实操和图RAG与趋势,提供实用的参数和代码示例。向量检索主要使用近似最近邻(ANN)算法,推荐HNSW作为工业标准,并结合量化技术以降低内存占用。最后,GraphRAG结合知识图谱与向量检索,提升多跳推理能力。

【大模型基础设施工程】18:向量库与图 RAG

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
第731期:机器学习可视化、向量数据库、类型检查器比较及更多(2026年4月21日)

本文介绍了与Python和机器学习相关的主题,包括机器学习算法可视化、ChromaDB向量数据库的使用、Python类型检查器的比较、安全最佳实践以及Django的业务逻辑解耦。此外,还提到了一些Python社区活动和新技术治理机制的反馈请求。

第731期:机器学习可视化、向量数据库、类型检查器比较及更多(2026年4月21日)

PyCoder’s Weekly
PyCoder’s Weekly · 2026-04-21T19:30:00Z
宣布2026年旧金山向量空间日

2026年6月11日,Qdrant将在旧金山举办第二届Vector Space Day,主题包括AI基础设施、搜索相关性和语义检索。活动将包括深度讨论、快速演讲和社交时光,并举行全球黑客马拉松,鼓励创新的向量搜索应用。

宣布2026年旧金山向量空间日

Qdrant - Vector Database
Qdrant - Vector Database · 2026-04-21T00:00:00Z

点积是衡量向量对齐程度的重要运算,结合了长度和方向。在Transformer中,点积用于高效计算注意力。其代数和几何定义相辅相成,代数便于计算,几何提供直观理解。点积在高维空间有效,但需注意随机向量趋于正交的现象。与其他相似度度量相比,点积在工程应用中,尤其是在GPU并行计算时更具优势。

【Transformer 与注意力机制】02 向量与点积的几何直觉

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-15T02:00:00Z

承诺方案是现代密码学的核心,确保消息的隐藏性和绑定性。主要包括哈希承诺、Pedersen承诺和KZG承诺,广泛应用于零知识证明、安全多方计算和区块链等领域。设计时需平衡隐藏性与绑定性,具有重要的实际意义。

【密码学百科】承诺方案:Pedersen 承诺、向量承诺与多项式承诺

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-09T00:00:00Z
混合搜索的优势:为什么您的RAG系统需要关键词搜索和向量搜索

混合搜索结合了BM25和向量检索,克服了纯向量和关键词搜索的不足,提升了检索准确性,适用于技术文档及法律医疗领域。通过双路径处理,优化查询结果,降低LLM成本,提高上下文质量。Redis支持混合搜索,简化操作,适合构建RAG系统和智能代理。

混合搜索的优势:为什么您的RAG系统需要关键词搜索和向量搜索

Redis Blog
Redis Blog · 2026-04-01T00:00:00Z
向量数据库的三种难度级别解析

向量数据库通过将非结构化数据转换为向量,支持相似性搜索。它们采用近似最近邻算法提高检索速度,解决大规模数据搜索问题。主要技术包括HNSW、IVF和PQ等索引方法,结合元数据过滤和混合检索,提升搜索精度和效率。

向量数据库的三种难度级别解析

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-26T14:55:52Z
掌握Qdrant的多向量搜索

Qdrant推出了免费的多向量搜索课程,旨在帮助开发者深入理解多向量检索。课程分为四个模块,涵盖文本、多模态搜索及优化评估,适合有基础的机器学习和搜索工程师。完成课程并通过认证考试可获得Qdrant证书。

掌握Qdrant的多向量搜索

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-24T00:00:00Z
修补LMDB:我们如何使Meilisearch的向量存储速度提升3倍

Meilisearch对LMDB进行了补丁,支持未提交写入的嵌套读取事务,提升了向量存储速度和索引时间。通过优化数据结构和减少全扫描,处理速度提高至每秒20个嵌入,显著提升搜索性能。新特性无需API更改,自2025年12月起在生产中使用。

修补LMDB:我们如何使Meilisearch的向量存储速度提升3倍

meilisearch blog
meilisearch blog · 2026-03-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码