Timescale Blog ·

使用OpenAI嵌入和Pgvector在PostgreSQL上进行相似性搜索

💡 原文英文，约2900词，阅读约需11分钟。

📝

内容提要

嵌入是数据的数值表示，用于捕捉语义或上下文关系。预训练的AI模型如BGE、Sentence Transformers、CLIP和Wav2Vec可生成嵌入。嵌入模型有助于构建RAG应用程序，通过相似性搜索提供准确和有上下文的响应。使用OpenAI Embeddings API和PostgreSQL进行嵌入生成和相似性搜索。

🎯

关键要点

嵌入是数据的数值表示，用于捕捉语义或上下文关系。
嵌入模型将对象表示为高维向量空间中的点，语义相似的对象在空间中相互靠近。
预训练的AI模型如BGE、Sentence Transformers、CLIP和Wav2Vec可生成嵌入。
OpenAI提供了多种文本嵌入模型，包括text-embedding-3-large和text-embedding-3-small。
嵌入模型有助于进行相似性搜索，超越传统的基于关键词的搜索。
RAG（检索增强生成）应用程序通过检索相关文档来增强LLM的生成能力。
RAG系统的步骤包括文档摄取、查询嵌入、文档检索、输入增强和响应生成。
使用OpenAI Embeddings API可以生成嵌入并构建RAG应用程序。
PostgreSQL结合pgvector、pgai和pgvectorscale可以实现高效的相似性搜索。
pgvector是一个开源扩展，增强了PostgreSQL的向量处理能力。
使用StreamingDiskANN索引可以加速大数据集的搜索。
通过SQL查询可以执行相似性搜索，返回语义相似的文档。

❓

延伸问答

什么是嵌入，它有什么用？

嵌入是数据的数值表示，用于捕捉语义或上下文关系，帮助进行相似性搜索。

如何使用OpenAI的嵌入模型生成向量嵌入？

可以通过OpenAI Embeddings API调用嵌入模型生成向量嵌入，使用Python代码进行API请求。

RAG应用程序的工作原理是什么？

RAG应用程序通过检索相关文档增强LLM的生成能力，步骤包括文档摄取、查询嵌入、文档检索、输入增强和响应生成。

PostgreSQL如何与pgvector结合进行相似性搜索？

PostgreSQL结合pgvector、pgai和pgvectorscale扩展，可以高效地存储和检索向量，实现相似性搜索。

OpenAI提供了哪些嵌入模型？

OpenAI提供了text-embedding-3-large、text-embedding-3-small和text-embedding-ada-002等嵌入模型。

如何加速大数据集的相似性搜索？

可以使用StreamingDiskANN索引来加速大数据集的相似性搜索，提升查询效率。

🏷️