古时的风筝 ·

向量数据库是什么

💡 原文中文，约2400字，阅读约需6分钟。

📝

内容提要

向量数据库是存储向量内容的数据库，常用于相似度搜索。向量化是将文本、音频、视频等内容转换为多维向量数组，并存储到向量数据库中的过程。向量数据库具有高可用性、高扩展性和计算密集型的特点，适用于文本搜索、图片、语音、视频搜索、推荐系统和异常检测等应用场景。

🎯

关键要点

向量数据库用于存储向量内容，常用于相似度搜索。
向量化是将文本、音频、视频等内容转换为多维向量数组的过程。
向量数据库具有高可用性、高扩展性和计算密集型的特点。
向量数据库适用于文本搜索、图片、语音、视频搜索、推荐系统和异常检测等应用场景。
向量是数学中的概念，可以表示为多维数组。
相似度搜索是向量数据库的主要应用场景，基于向量化和索引技术。
Embedding是用低维稠密向量表示对象的过程，反映对象之间的相似性。
主流的Embedding方法包括矩阵分解法、基于自然语言处理的方法和基于图的方法。
向量数据库需要高可用、高扩展性的架构，适合存储海量数据。
向量数据库的应用场景包括文本搜索、图片、语音、视频搜索、推荐系统和异常检测。

🏷️

标签

向量向量化向量数据库数据库相似度搜索高可用性高扩展性

➡️

继续阅读

LiteServer荷兰存储VPS：AMD EPYC平台，大带宽+大硬盘，年付€30起
LiteServer是成立于2007年的荷兰本土老牌主机商，全系产品部署于荷兰数据中心，采用KVM虚拟化架构， […]
看美团 CatPaw：Agent 平台真正难的不是会聊天，而是能不能进流程
美团发布 CatPaw，把 LongCat 2.0 的模型能力包装成个人工作台和企业级 Agent 开发托管平台。比起模型参数，我更关心它进到真实业务流程...
The US is banning foreign robots
The US government is targeting China with a new import ban on "advanced r...
Claude Code Tools 研究系列（一）—— AskUserQuestion：把「AI 提问」变成结构化交互原语
Claude Code Tools 系列开篇：拆解 AskUserQuestion 这个「结构化提问工具」的设计。用「登录方案选型」这个具体场景对比自由文...
How NorthStar Anesthesia built a scheduling app for a workforce of 3,000 clinicians in weeks
IntroductionNorthStar Anesthesia manages anesthesia staffing services across ...
主客二分这场哲学病怎么治京都学派用“空”掀了西方三千年桌子
主体跟客体的这场架，打了三千年还没打完。西方哲学非要把人和世界切开成两块，再拼命找胶水粘回去。京都学派直接掀了桌子，说这场架在开打之前就已经赢了。那个...