小红花·文摘

AntSK-PyApi是基于FastAPI的本地Embedding和Rerank一站式API服务，支持多种主流模型，便于AI开发者和新手用户使用。通过简单命令即可实现文本向量化和文档重排序，简化了本地部署的复杂性。

还在为本地部署 Embedding/Rerank 抓狂？AntSK-PyApi让你三分钟变身AI高手！

dotNET跨平台 ·

词嵌入与文本向量化的温和介绍

MachineLearningMastery.com ·

谷歌推出基于Gemini的新文本向量化模型

DEV Community ·

小本本系列：大模型中的文本向量text embeddings

Shadow Walker 松烟阁 ·

文本向量化是将文本转换为数值形式的过程。CountVectorizer生成词频矩阵，适合简单统计；TfidfVectorizer生成加权矩阵，更能区分词义。使用scikit-learn库可以实现这两种方法，选择取决于具体问题和数据性质。

词频向量化与TF-IDF向量化

DEV Community ·

本文介绍了RAG技术的基础，包括文本向量化和信息检索。BERT是一种基于transformer的预训练语言模型，能够生成dense embedding。BGE-M3是一种结合了传统sparse embedding和dense embedding优点的学习型embedding。文章还介绍了BGE-M3的工作原理和实战应用。

大模型 RAG 基础：信息检索、文本向量化及 BGE-M3 embedding 实践（2024）

ARTHURCHIAO'S BLOG ·

本文介绍了基于RAG+大模型的中文文本向量化方法和发展历程，包括传统模型的局限性和预训练文本嵌入模型的优势。同时，文章还提供了使用Ollama和Go语言实现文本向量化的示例代码。最后，文章推荐了Gopher部落知识星球作为学习和交流平台，并推荐了DigitalOcean的主机计划。

使用Ollama和Go基于文本嵌入模型实现文本向量化

Tony Bai ·

如何计算向量数据的相似度？

Jacky's Blog ·

5分钟使用DeepSeek构建RAG

Qdrant - Vector Database ·