小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI购物助手:工作原理及构建指南

AI购物助手利用大语言模型和向量嵌入技术,提高产品搜索和个性化推荐的效率。主要分为语义搜索引擎、RAG助手、代理系统、视觉搜索和个性化引擎五类。关键在于快速、准确的数据检索,以确保助手的可靠性和用户信任。Redis平台通过内存优先架构,提供低延迟的向量搜索和语义缓存,优化购物体验。

AI购物助手:工作原理及构建指南

Redis Blog
Redis Blog · 2026-05-12T00:00:00Z
Data Graphs如何构建真正的混合图RAG平台

Data Graphs是一家英国公司,提供结合图数据库、全文搜索和向量嵌入的知识图谱服务。其平台通过Qdrant实现混合检索,克服了仅依赖向量检索的局限性,支持复杂数据的高效检索。经过18个月的生产运行,Qdrant表现稳定,未来将向机器优先的方向发展。

Data Graphs如何构建真正的混合图RAG平台

Qdrant - Vector Database
Qdrant - Vector Database · 2026-04-22T00:00:00Z
什么是pgvector?

pgvector是一个开源的PostgreSQL扩展,支持存储和搜索向量嵌入,适用于语义搜索和推荐功能。它简化了相似性搜索,能够处理数百万到数千万个向量,支持余弦相似度,并可与Postgres全文搜索结合使用。对于高性能需求,pgvectorscale可扩展pgvector的能力。

什么是pgvector?

Databricks
Databricks · 2026-04-17T06:59:30Z
向量嵌入生成器:工作原理及使用方法

向量嵌入生成器将文本、图像或代码等原始输入转换为数值向量,使相似概念聚集在一起,从而实现基于意义的检索,如聊天机器人和推荐引擎。选择合适的生成器对检索质量和基础设施成本至关重要。生成器通常基于变换器架构,能够捕捉上下文和意义。在评估生成器时,需要考虑模型选择、部署方式及其与实际数据的匹配程度。Redis提供快速的向量搜索和混合检索,适合生产环境。

向量嵌入生成器:工作原理及使用方法

Redis Blog
Redis Blog · 2026-03-31T00:00:00Z
你的pgvector基准测试为何会误导你

pgvector是一个开源Postgres扩展,支持在关系数据中存储和查询向量嵌入。最近的改进,如HNSW索引,提升了查询性能。成功使用pgvector需要基准测试、调整索引参数,并结合SQL操作来优化性能,特别关注冷缓存性能和数据分区策略。

你的pgvector基准测试为何会误导你

The New Stack
The New Stack · 2026-03-27T12:00:00Z
SaaS中的语义搜索:当关键词不足以满足需求时

语义搜索利用向量嵌入和变换神经网络理解用户意图,提升搜索体验。它能处理模糊查询,降低零结果率,适合SaaS应用。实现时需构建嵌入生成基础设施和向量存储,Redis可支持快速向量搜索。主要应用于企业知识管理、客户支持和开发工具,适合自然语言表达需求的场景。

SaaS中的语义搜索:当关键词不足以满足需求时

Redis Blog
Redis Blog · 2026-02-08T00:00:00Z
LLM应用的语义缓存:降低成本40-80%,提升速度250倍

本文讨论了语义缓存的概念,旨在解决聊天机器人API费用过高的问题。通过使用向量嵌入,语义缓存能够基于查询的含义而非文本匹配,提高命中率,降低成本,加快响应速度。文章还提供了实现语义缓存的步骤和Python代码示例,强调其在客户支持和常见问题解答中的应用价值。

LLM应用的语义缓存:降低成本40-80%,提升速度250倍

Percona Database Performance Blog
Percona Database Performance Blog · 2026-02-04T15:03:29Z
学习 AI 的最大障碍,不懂大模型背后的灵魂

99%的人在使用AI时误以为AI能理解语言,实际上AI只处理数字。要掌握AI,需理解向量嵌入,它将概念映射到数学空间。AI通过向量运算理解关系,掌握坐标系是未来的竞争优势。

学习 AI 的最大障碍,不懂大模型背后的灵魂

dotNET跨平台
dotNET跨平台 · 2026-01-19T00:02:46Z
RAG 教程笔记(Task03)

向量嵌入技术将复杂数据转化为低维向量,提升检索质量。多模态嵌入实现跨模态对齐,打破数据类型壁垒。向量数据库高效管理和查询高维向量,支持AI应用。Milvus是开源的分布式向量数据库,适合大规模相似性搜索,通过优化索引提升检索精确性与效率。

RAG 教程笔记(Task03)

程序员充电站
程序员充电站 · 2025-12-25T08:54:47Z
戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

本文介绍如何使用pgEdge Vectorizer将文档分块并生成向量嵌入,以实现基于语义的搜索。通过将文档拆分为小块,系统能够更精确地检索相关内容。pgEdge Vectorizer作为PostgreSQL扩展,自动处理文档更新和嵌入生成,简化管理流程。

戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第2部分:文档分块与嵌入

Planet PostgreSQL
Planet PostgreSQL · 2025-12-09T06:30:44Z
戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第1部分:加载您的内容

检索增强生成(RAG)为大型语言模型提供了访问自有数据的有效方法。通过检索相关内容并提供上下文,RAG能够生成基于实际内容的准确响应。本文将介绍如何使用PostgreSQL构建RAG服务器,包括文档加载、生成向量嵌入和API服务器部署。

戴夫·佩奇:使用PostgreSQL构建RAG服务器 - 第1部分:加载您的内容

Planet PostgreSQL
Planet PostgreSQL · 2025-12-04T06:30:02Z
从零开始构建简单检索增强生成(RAG)系统的七个步骤

本文介绍了构建检索增强生成(RAG)系统的七个步骤,包括数据预处理、文本分块、生成向量嵌入、检索信息、结合上下文、生成答案及完整流程运行,以提高大型语言模型(LLM)的回答准确性。

从零开始构建简单检索增强生成(RAG)系统的七个步骤

KDnuggets
KDnuggets · 2025-11-17T15:00:21Z
如何掌握向量数据库

向量数据库专为存储和搜索高维向量而设计,改变了处理非结构化数据的方式,适用于推荐系统和图像检索等应用。它们通过计算向量间的距离,快速找到相似数据。常见的向量数据库包括Milvus、Pinecone和Weaviate,支持与机器学习工作流的无缝集成。理解向量嵌入是使用这些数据库的基础。

如何掌握向量数据库

The New Stack
The New Stack · 2025-04-28T13:00:26Z
使用Go、Azure Cosmos DB和OpenAI轻松生成向量嵌入

本文介绍了如何构建一个简单的Web应用程序,快速生成数据的向量嵌入并存储在Azure Cosmos DB中。该应用使用Go语言开发,支持多种文档类型,便于向量搜索和检索增强生成(RAG)工作流。用户需配置Azure Cosmos DB和Azure OpenAI的信息,并通过服务主体管理权限。配置完成后,用户可以上传文件并生成向量嵌入,以便后续查询。

使用Go、Azure Cosmos DB和OpenAI轻松生成向量嵌入

DEV Community
DEV Community · 2025-04-21T08:04:12Z
解读人工智能术语:开发者理解基础知识指南

本文介绍了人工智能中的基本概念,包括分词、向量嵌入、位置编码和自注意力机制。分词将文本拆分为可处理单元,向量嵌入为单元赋予数学意义,位置编码帮助模型理解词序,自注意力机制使模型根据上下文理解词义。这些概念是现代大型语言模型理解和处理语言的基础。

解读人工智能术语:开发者理解基础知识指南

DEV Community
DEV Community · 2025-04-09T06:29:48Z
如何在 Node.js 中创建向量嵌入

构建检索增强生成(RAG)应用时,需准备数据,包括将非结构化数据分块、生成向量嵌入并存储在向量数据库中。可以通过本地模型、API或框架生成向量嵌入,使用Transformers.js等工具在Node.js中实现特征提取。选择合适的方法和模型对数据处理至关重要。

如何在 Node.js 中创建向量嵌入

DEV Community
DEV Community · 2025-04-03T21:43:17Z
智能代理中的内存缓存与语义缓存:何时使用哪种?

在智能代理领域,缓存的使用非常重要。传统缓存存储精确匹配的完整答案,适合重复提示和低延迟需求;而语义缓存则利用向量嵌入,根据语义相似性存储信息,适合处理语言变体。两者结合使用可以提升响应速度和个性化体验。

智能代理中的内存缓存与语义缓存:何时使用哪种?

DEV Community
DEV Community · 2025-03-22T00:17:11Z
为什么向量量化对人工智能工作负载至关重要

随着向量嵌入规模的扩大,内存使用和查询延迟增加,导致成本上升和用户体验下降。通过低精度格式存储嵌入,可以显著降低内存需求并加快检索速度。MongoDB Atlas简化了压缩向量的创建、存储和索引,支持AI应用的高效扩展。量化技术在保持准确性的同时,压缩高维嵌入,解决了大规模AI工作负载的内存、延迟和成本问题。

为什么向量量化对人工智能工作负载至关重要

MongoDB
MongoDB · 2025-02-27T15:00:00Z
Pgai Vectorizer与Python的结合:集成SQLAlchemy和Alembic

pgai Vectorizer的推出改变了开发者使用向量嵌入的方式,通过SQL命令自动化创建和管理嵌入,简化了传统流程。本文介绍如何使用Python和SQLAlchemy与pgai Vectorizer集成,创建博客应用的嵌入管理,支持多种嵌入模型并自动同步数据,提高开发效率。

Pgai Vectorizer与Python的结合:集成SQLAlchemy和Alembic

Timescale Blog
Timescale Blog · 2025-02-20T14:00:11Z
Using AI to Summarize Long Documents

本文探讨了如何利用AI进行长文档的摘要,特别是超出大型语言模型上下文窗口的情况。作者开发了名为summarize.wtf的应用,支持用户上传多种格式的文档并生成不同长度的摘要。通过将文档分段、生成向量嵌入并结合K-means聚类,提取关键主题,从而实现高质量摘要。这种方法在成本和效率上具有优势,适用于各种长度的文档。

Using AI to Summarize Long Documents

DemoChen's Clip
DemoChen's Clip · 2025-02-19T09:55:29Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码