小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
什么是pgvector?

pgvector是一个开源的PostgreSQL扩展,支持存储和搜索向量嵌入,适用于语义搜索和推荐功能。它简化了相似性搜索,能够处理数百万到数千万个向量,支持余弦相似度,并可与Postgres全文搜索结合使用。对于高性能需求,pgvectorscale可扩展pgvector的能力。

什么是pgvector?

Databricks
Databricks · 2026-04-17T06:59:30Z
向量嵌入生成器:工作原理及使用方法

向量嵌入生成器将文本、图像或代码等原始输入转换为数值向量,使相似概念聚集在一起,从而实现基于意义的检索,如聊天机器人和推荐引擎。选择合适的生成器对检索质量和基础设施成本至关重要。生成器通常基于变换器架构,能够捕捉上下文和意义。在评估生成器时,需要考虑模型选择、部署方式及其与实际数据的匹配程度。Redis提供快速的向量搜索和混合检索,适合生产环境。

向量嵌入生成器:工作原理及使用方法

Redis Blog
Redis Blog · 2026-03-31T00:00:00Z
你的pgvector基准测试为何会误导你

pgvector是一个开源Postgres扩展,支持在关系数据中存储和查询向量嵌入。最近的改进,如HNSW索引,提升了查询性能。成功使用pgvector需要基准测试、调整索引参数,并结合SQL操作来优化性能,特别关注冷缓存性能和数据分区策略。

你的pgvector基准测试为何会误导你

The New Stack
The New Stack · 2026-03-27T12:00:00Z
SaaS中的语义搜索:当关键词不足以满足需求时

语义搜索利用向量嵌入和变换神经网络理解用户意图,提升搜索体验。它能处理模糊查询,降低零结果率,适合SaaS应用。实现时需构建嵌入生成基础设施和向量存储,Redis可支持快速向量搜索。主要应用于企业知识管理、客户支持和开发工具,适合自然语言表达需求的场景。

SaaS中的语义搜索:当关键词不足以满足需求时

Redis Blog
Redis Blog · 2026-02-08T00:00:00Z
LLM应用的语义缓存:降低成本40-80%,提升速度250倍

本文讨论了语义缓存的概念,旨在解决聊天机器人API费用过高的问题。通过使用向量嵌入,语义缓存能够基于查询的含义而非文本匹配,提高命中率,降低成本,加快响应速度。文章还提供了实现语义缓存的步骤和Python代码示例,强调其在客户支持和常见问题解答中的应用价值。

LLM应用的语义缓存:降低成本40-80%,提升速度250倍

Percona Database Performance Blog
Percona Database Performance Blog · 2026-02-04T15:03:29Z
学习 AI 的最大障碍,不懂大模型背后的灵魂

99%的人在使用AI时误以为AI能理解语言,实际上AI只处理数字。要掌握AI,需理解向量嵌入,它将概念映射到数学空间。AI通过向量运算理解关系,掌握坐标系是未来的竞争优势。

学习 AI 的最大障碍,不懂大模型背后的灵魂

dotNET跨平台
dotNET跨平台 · 2026-01-19T00:02:46Z
RAG 教程笔记(Task03)

向量嵌入技术将复杂数据转化为低维向量,提升检索质量。多模态嵌入实现跨模态对齐,打破数据类型壁垒。向量数据库高效管理和查询高维向量,支持AI应用。Milvus是开源的分布式向量数据库,适合大规模相似性搜索,通过优化索引提升检索精确性与效率。

RAG 教程笔记(Task03)

程序员充电站
程序员充电站 · 2025-12-25T08:54:47Z
戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

本文介绍如何使用pgEdge Vectorizer将文档分块并生成向量嵌入,以实现基于语义的搜索。通过将文档拆分为小块,系统能够更精确地检索相关内容。pgEdge Vectorizer作为PostgreSQL扩展,自动处理文档更新和嵌入生成,简化管理流程。

戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

Planet PostgreSQL
Planet PostgreSQL · 2025-12-09T06:30:44Z
戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第1部分:加载您的内容

检索增强生成(RAG)为大型语言模型提供了访问自有数据的有效方法。通过检索相关内容并提供上下文,RAG能够生成基于实际内容的准确响应。本文将介绍如何使用PostgreSQL构建RAG服务器,包括文档加载、生成向量嵌入和API服务器部署。

戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第1部分:加载您的内容

Planet PostgreSQL
Planet PostgreSQL · 2025-12-04T06:30:02Z
从零开始构建简单检索增强生成(RAG)系统的七个步骤

本文介绍了构建检索增强生成(RAG)系统的七个步骤,包括数据预处理、文本分块、生成向量嵌入、检索信息、结合上下文、生成答案及完整流程运行,以提高大型语言模型(LLM)的回答准确性。

从零开始构建简单检索增强生成(RAG)系统的七个步骤

KDnuggets
KDnuggets · 2025-11-17T15:00:21Z
如何掌握向量数据库

向量数据库专为存储和搜索高维向量而设计,改变了处理非结构化数据的方式,适用于推荐系统和图像检索等应用。它们通过计算向量间的距离,快速找到相似数据。常见的向量数据库包括Milvus、Pinecone和Weaviate,支持与机器学习工作流的无缝集成。理解向量嵌入是使用这些数据库的基础。

如何掌握向量数据库

The New Stack
The New Stack · 2025-04-28T13:00:26Z
使用Go、Azure Cosmos DB和OpenAI轻松生成向量嵌入

本文介绍了如何构建一个简单的Web应用程序,快速生成数据的向量嵌入并存储在Azure Cosmos DB中。该应用使用Go语言开发,支持多种文档类型,便于向量搜索和检索增强生成(RAG)工作流。用户需配置Azure Cosmos DB和Azure OpenAI的信息,并通过服务主体管理权限。配置完成后,用户可以上传文件并生成向量嵌入,以便后续查询。

使用Go、Azure Cosmos DB和OpenAI轻松生成向量嵌入

DEV Community
DEV Community · 2025-04-21T08:04:12Z
解读人工智能术语:开发者理解基础知识指南

本文介绍了人工智能中的基本概念,包括分词、向量嵌入、位置编码和自注意力机制。分词将文本拆分为可处理单元,向量嵌入为单元赋予数学意义,位置编码帮助模型理解词序,自注意力机制使模型根据上下文理解词义。这些概念是现代大型语言模型理解和处理语言的基础。

解读人工智能术语:开发者理解基础知识指南

DEV Community
DEV Community · 2025-04-09T06:29:48Z
如何在 Node.js 中创建向量嵌入

构建检索增强生成(RAG)应用时,需准备数据,包括将非结构化数据分块、生成向量嵌入并存储在向量数据库中。可以通过本地模型、API或框架生成向量嵌入,使用Transformers.js等工具在Node.js中实现特征提取。选择合适的方法和模型对数据处理至关重要。

如何在 Node.js 中创建向量嵌入

DEV Community
DEV Community · 2025-04-03T21:43:17Z
智能代理中的内存缓存与语义缓存:何时使用哪种?

在智能代理领域,缓存的使用非常重要。传统缓存存储精确匹配的完整答案,适合重复提示和低延迟需求;而语义缓存则利用向量嵌入,根据语义相似性存储信息,适合处理语言变体。两者结合使用可以提升响应速度和个性化体验。

智能代理中的内存缓存与语义缓存:何时使用哪种?

DEV Community
DEV Community · 2025-03-22T00:17:11Z
为什么向量量化对人工智能工作负载至关重要

随着向量嵌入规模的扩大,内存使用和查询延迟增加,导致成本上升和用户体验下降。通过低精度格式存储嵌入,可以显著降低内存需求并加快检索速度。MongoDB Atlas简化了压缩向量的创建、存储和索引,支持AI应用的高效扩展。量化技术在保持准确性的同时,压缩高维嵌入,解决了大规模AI工作负载的内存、延迟和成本问题。

为什么向量量化对人工智能工作负载至关重要

MongoDB
MongoDB · 2025-02-27T15:00:00Z
Pgai Vectorizer与Python的结合:集成SQLAlchemy和Alembic

pgai Vectorizer的推出改变了开发者使用向量嵌入的方式,通过SQL命令自动化创建和管理嵌入,简化了传统流程。本文介绍如何使用Python和SQLAlchemy与pgai Vectorizer集成,创建博客应用的嵌入管理,支持多种嵌入模型并自动同步数据,提高开发效率。

Pgai Vectorizer与Python的结合:集成SQLAlchemy和Alembic

Timescale Blog
Timescale Blog · 2025-02-20T14:00:11Z
Using AI to Summarize Long Documents

本文探讨了如何利用AI进行长文档的摘要,特别是超出大型语言模型上下文窗口的情况。作者开发了名为summarize.wtf的应用,支持用户上传多种格式的文档并生成不同长度的摘要。通过将文档分段、生成向量嵌入并结合K-means聚类,提取关键主题,从而实现高质量摘要。这种方法在成本和效率上具有优势,适用于各种长度的文档。

Using AI to Summarize Long Documents

DemoChen's Clip
DemoChen's Clip · 2025-02-19T09:55:29Z
🚀 pgai Vectorizer:SQLAlchemy和LiteLLM让向量搜索变得简单

pgai Vectorizer简化了AI应用的嵌入管理,支持SQLAlchemy和LiteLLM,允许开发者通过单一SQL命令轻松切换向量嵌入提供商,从而提升灵活性和效率。

🚀 pgai Vectorizer:SQLAlchemy和LiteLLM让向量搜索变得简单

DEV Community
DEV Community · 2025-02-18T16:55:20Z
用于RAG设置的向量数据库与带pg_vector的PostgreSQL

向量嵌入在现代AI工作流中至关重要。开发者可选择专用向量数据库(如Milvus、Pinecone)或PostgreSQL的pg_vector扩展。专用数据库优化查询和扩展性,但学习成本较高;PostgreSQL则简化数据管理,适合已有基础设施。选择应基于具体需求、预算和现有系统。

用于RAG设置的向量数据库与带pg_vector的PostgreSQL

DEV Community
DEV Community · 2025-02-10T03:01:18Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码