小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从零开始实现向量搜索:一步一步的教程

本文介绍了如何从零开始实现向量搜索。向量搜索通过将查询和文档转换为数值向量,匹配语义而非关键词,从而提高搜索智能性。文章详细讲解了向量表示、相似度计算和检索步骤,并提供了Python实现示例,包括数据集创建、向量转换和余弦相似度计算。最终,读者将掌握向量搜索的基本原理及其应用。

从零开始实现向量搜索:一步一步的教程

MachineLearningMastery.com
MachineLearningMastery.com · 2025-06-10T14:49:47Z

文本嵌入模型将文本转换为数值向量,支持文本相似度计算和信息检索等任务。MTEB排行榜评估了250多个模型,涵盖多语言和多任务,适用于不同领域。选择模型时需考虑任务类型、语言支持和计算资源等因素。

文本嵌入模型的选择 - 蝈蝈俊

蝈蝈俊
蝈蝈俊 · 2025-04-03T06:42:00Z
余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

研究表明,余弦相似度在高维对象的相似性测量中可能导致无意义的结果,尤其在深度学习模型中。因此,建议谨慎使用余弦相似度,并提出欧几里得距离和点积等替代方案,以提高相似度计算的可靠性。

余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

机器之心
机器之心 · 2025-01-14T06:24:00Z
什么是语义匹配?如何使用自然语言处理在文档中查找词语

本文介绍了语义匹配的概念及其在自然语言处理中的应用。与传统的精确匹配方法不同,语义匹配关注词语的意义和上下文。利用Python及相关库(如KeyBERT和SentenceTransformer),可以提取关键词并计算与特定短语(如“避孕”)的相似度,从而有效找到相关内容。

什么是语义匹配?如何使用自然语言处理在文档中查找词语

freeCodeCamp.org
freeCodeCamp.org · 2025-01-09T19:27:37Z
介绍VecSpark

VecSpark是一个基于PySpark的库,旨在高效处理大规模向量嵌入。它支持多种相似度计算方法,并能将大文本分块以便存储和处理,适用于大规模NLP和分析应用。

介绍VecSpark

DEV Community
DEV Community · 2024-12-07T21:50:39Z
三种自然语言聚类分析处理的工具和使用体验

自然语言处理(NLP)是计算机科学与人工智能的重要领域,旨在实现人与计算机的自然语言交流。文本聚类是NLP的一个应用,通过相似度将文本自动归类。传统的聚类方法如K-Means和层次聚类在特征选择和相似度度量上存在局限性,而深度学习方法通过文本表示学习和相似度计算显著提升了聚类效果。结合大语言模型进行聚类分析,展示了不同方法的优缺点。

三种自然语言聚类分析处理的工具和使用体验

dotNET跨平台
dotNET跨平台 · 2024-10-20T00:00:29Z

本文介绍了多种针对抽象意义表示(AMR)的新方法和度量标准,如 S$^2$match、SMARAGD 和 SEMBLEU。这些方法在 AMR 图的相似度计算、解析准确性和多语言句子嵌入性能方面表现出色,显示了在语义评估和生成文本质量评估中的潜力。研究表明,这些新指标和算法在控制偏差和提高准确性方面优于传统方法。

重新匹配:改善结构和语义相似度的本地知识图匹配的鲁棒且高效方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z

句子嵌入是句子的向量表示,可以通过池化方法计算。池化是一种常用方法,通过BERT模型的[CLS]标记嵌入来表示整个句子。句子嵌入可用于文本分类和相似度计算等任务。使用句子转换器库可以获得更高质量的嵌入。选择合适的模型可根据任务需求和性能指标评估。嵌入的生态系统包括工具、数据库和相关研究。

语句嵌入简单入门教程

极道
极道 · 2024-01-08T11:16:00Z
如何计算向量数据的相似度?

本文介绍了文本向量化的传统做法和现成的向量化大模型,以及如何计算向量数据的相似度,包括余弦相似度和欧式距离算法。同时,介绍了t-SNE算法的应用,可以将向量数据可视化,最后讲述了如何应用在相似度检测上。

如何计算向量数据的相似度?

Jacky's Blog
Jacky's Blog · 2023-10-18T00:00:00Z
稀疏向量与倒排索引

稀疏向量是高维向量,主要用于关键词搜索和推荐系统。它们在少数维度上有值,其他维度为零。通过倒排索引,可以高效存储和检索稀疏向量,快速找到相似向量。Qdrant支持稀疏向量的配置和存储,使用点积计算相似度。

稀疏向量与倒排索引

Qdrant - Vector Database
Qdrant - Vector Database · 1970-01-01T08:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码