Percona Database Performance Blog ·

使用开源工具和pgvector创建AI专家

💡 原文英文，约2800词，阅读约需10分钟。

📝

内容提要

2023年是AI的一年，许多公司正在思考如何利用AI提高用户体验。本文将解释如何利用公司数据构建自己的AI专家。

🎯

关键要点

2023年是人工智能（AI）的一年，许多公司正在思考如何利用AI提升用户体验。
利用公司数据（内部文档、工单系统等）可以更快或自动地回答客户问题。
本文将解释如何使用公司数据构建自己的AI专家，避免使用非开源工具。
构建AI专家的步骤包括：提供基础设施、捕获公司数据并存储在PostgreSQL中、提问和生成响应。
向读者解释了一些术语，如向量嵌入、大型语言模型（LLM）和令牌。
向量嵌入是数据的数值表示，能够捕捉其含义和关系，通常存储在向量数据库中。
大型语言模型（LLM）是驱动AI的深度学习算法集合，能够执行多种任务。
pgvector是PostgreSQL的扩展，允许存储向量嵌入，适合构建AI应用。
使用GPU可以加速向量嵌入的创建，Python是机器学习任务中广泛使用的语言。
生成嵌入时，使用Hugging Face的sentence_transformers库。
在将数据加载到pgvector之前，建议将文本分割成较小的块以提高语义搜索的效果。
一旦向量嵌入存储在数据库中，可以通过语义搜索找到相关内容。
使用Hugging Face的pipeline可以将用户问题与上下文结合，生成回答。
建议在实际应用中对模型进行训练，以提高回答的准确性。
使用开源工具和公共API可以轻松创建基于公司数据的AI或聊天机器人，提升用户体验。

🏷️

标签

AI专家 ai pgvector 人工智能公司数据开源用户体验

➡️

继续阅读

AI-DLC 在数据工程中的实践：从分层建模到数据质量的全流程协作
本文将介绍 AI-DLC（AI-Driven Development Life Cycle）——亚马逊云科技于 2025 年提出的一套开发方法论——在数据...
开源私有云软件Nextcloud遭到黑客攻击网站被黑但开发商谎称基础架构问题
#安全资讯开源私有云软件 Nextcloud 遭到黑客攻击，网站被黑但开发商谎称是基础设施架构问题。这件事发生在昨天早晨，当时 Nextcloud 被重...
AI分析表明：胸背强壮的人患心脏病的风险较低
健身房练胸练背，居然比吃降压药更保命？你这是把心脏当博物馆藏品，只围观不保养吧？一项覆盖1722名胸痛患者、利用AI分析胸部CT的追踪研究显示，胸腔和背...
LG Uplus 与爱立信公布语音 AI 合作协议
LG Uplus 与全球电信设备公司爱立信携手合作。 LG Uplus宣布，于当地时间7月14日在瑞典斯德哥尔摩的爱立信总部签署了一项战略合作协议，旨在推...
AI 经济在联络中心遭遇尴尬
相信我们大多数人都曾在超市经历过那种令人沮丧的时刻：为了省几块钱，你拿起了超市自有品牌的产品，结果在结账时才发现，那款看起来高档的手工制作产品其实正在打折...
俄罗斯科学家用AI算命：模拟算出人类寿命上限是194岁
研究人员首次定量评估发现，仅体细胞突变就将人类寿命限制在146-194岁。脑细胞和心肌细胞是主要的寿命瓶颈，而肝脏则可以存活数千年。要我说，这科学界天天...