💡
原文英文,约1000词,阅读约需4分钟。
📝
内容提要
Chroma DB是一个面向GenAI应用的向量数据库,采用无模式设计,使用固定列存储文档、元数据和嵌入。它支持CRUD操作和多种查询方式,包括相似性搜索和元数据过滤,提升了文档检索的精确性。
🎯
关键要点
- Chroma DB是一个面向GenAI应用的向量数据库,采用无模式设计。
- Chroma DB使用固定列存储文档、元数据和嵌入,支持CRUD操作。
- 文档用于插入文本数据以生成嵌入,嵌入用于执行相似性搜索。
- 元数据用于关联额外数据以提供上下文。
- 集合在Chroma中类似于SQL中的表,可以创建、获取、更新和删除。
- 查询可以通过多种方式进行,包括相似性搜索和元数据过滤。
- 相似性搜索可以基于文本或嵌入进行,返回最相似的结果。
- 元数据过滤允许根据文档的附加信息进行筛选。
- 文档内容过滤允许根据文档中包含的特定关键词进行筛选。
- Chroma DB支持多种操作符,如$contains、$startsWith和$endsWith,以增强查询精度。
➡️