小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

AntSK-PyApi是基于FastAPI的本地Embedding和Rerank一站式API服务,支持多种主流模型,便于AI开发者和新手用户使用。通过简单命令即可实现文本向量化和文档重排序,简化了本地部署的复杂性。

还在为本地部署 Embedding/Rerank 抓狂?AntSK-PyApi让你三分钟变身AI高手!

dotNET跨平台
dotNET跨平台 · 2025-06-12T01:04:13Z
词嵌入与文本向量化的温和介绍

文章介绍了词嵌入和文本向量化的基本概念,强调计算机如何通过数字表示理解人类语言。文本向量化将文本转换为机器可处理的数字形式,常见方法包括独热编码、词袋模型和TF-IDF。词嵌入通过学习低维表示捕捉词语之间的语义关系。现代上下文嵌入模型如ELMo和BERT,能够根据上下文动态生成词向量,提高自然语言处理的准确性和效率。

词嵌入与文本向量化的温和介绍

MachineLearningMastery.com
MachineLearningMastery.com · 2025-05-23T13:59:44Z
谷歌推出基于Gemini的新文本向量化模型

谷歌推出实验性工具Gemini Embedding,该文本向量化模型可将文本转化为数值表示,提升文档搜索和分类效率。支持百余种语言,当前处于实验阶段,输入限制为8000个标记,预计几个月后发布完整版本。

谷歌推出基于Gemini的新文本向量化模型

DEV Community
DEV Community · 2025-03-26T09:13:11Z
小本本系列:大模型中的文本向量text embeddings

本文探讨了文本向量化方法,包括词袋模型、TF-IDF、word2vec和transformer模型,这些技术提升了计算机对自然语言的理解,特别是通过嵌入表示捕捉语义。同时,文章讨论了余弦相似度和欧几里得距离等不同距离度量在向量比较中的应用。

小本本系列:大模型中的文本向量text embeddings

Shadow Walker 松烟阁
Shadow Walker 松烟阁 · 2024-12-08T11:39:43Z

文本向量化是将文本转换为数值形式的过程。CountVectorizer生成词频矩阵,适合简单统计;TfidfVectorizer生成加权矩阵,更能区分词义。使用scikit-learn库可以实现这两种方法,选择取决于具体问题和数据性质。

词频向量化与TF-IDF向量化

DEV Community
DEV Community · 2024-10-08T18:29:00Z

本文介绍了RAG技术的基础,包括文本向量化和信息检索。BERT是一种基于transformer的预训练语言模型,能够生成dense embedding。BGE-M3是一种结合了传统sparse embedding和dense embedding优点的学习型embedding。文章还介绍了BGE-M3的工作原理和实战应用。

大模型 RAG 基础:信息检索、文本向量化及 BGE-M3 embedding 实践(2024)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2024-08-04T00:00:00Z

本文介绍了基于RAG+大模型的中文文本向量化方法和发展历程,包括传统模型的局限性和预训练文本嵌入模型的优势。同时,文章还提供了使用Ollama和Go语言实现文本向量化的示例代码。最后,文章推荐了Gopher部落知识星球作为学习和交流平台,并推荐了DigitalOcean的主机计划。

使用Ollama和Go基于文本嵌入模型实现文本向量化

Tony Bai
Tony Bai · 2024-05-08T22:13:17Z
如何计算向量数据的相似度?

本文介绍了文本向量化的传统做法和现成的向量化大模型,以及如何计算向量数据的相似度,包括余弦相似度和欧式距离算法。同时,介绍了t-SNE算法的应用,可以将向量数据可视化,最后讲述了如何应用在相似度检测上。

如何计算向量数据的相似度?

Jacky's Blog
Jacky's Blog · 2023-10-18T00:00:00Z
5分钟使用DeepSeek构建RAG

本文介绍了如何使用Qdrant和DeepSeek构建检索增强生成(RAG)管道。RAG管道通过提供相关数据来增强大型语言模型(LLM)的响应。教程包括文本向量化、存储在Qdrant中、与DeepSeek连接及测试回答准确性等步骤。使用DeepSeek API时需提供API密钥,RAG管道通过丰富提示内容提高回答准确性,减少错误回答。

5分钟使用DeepSeek构建RAG

Qdrant - Vector Database
Qdrant - Vector Database · 1970-01-01T08:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码