小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
一文吃透Ollama Embeddings:概念、实操、避坑,助力RAG落地|本地部署AI大模型必备

本文介绍了Ollama中的嵌入向量及其在检索增强生成中的应用。嵌入向量将文本转换为数值数组,以便计算语义相似度。文章探讨了嵌入向量的生成方法、应用场景(如搜索引擎、去重、推荐系统)以及常见问题和解决方案,帮助新手理解和应用该技术。

一文吃透Ollama Embeddings:概念、实操、避坑,助力RAG落地|本地部署AI大模型必备

人言兑
人言兑 · 2026-04-24T10:40:15Z
.NET 9 打造智能图像检索系统:AI 视觉 + 向量搜索实战

本文介绍了一种基于.NET 9的智能图像检索与管理系统,结合AI视觉技术,实现自然语言搜索和快速图像处理,支持批量上传、自动分析和生成描述,适合个人和团队使用。

.NET 9 打造智能图像检索系统:AI 视觉 + 向量搜索实战

dotNET跨平台
dotNET跨平台 · 2026-03-02T00:02:23Z
.NET+AI | MEAI | 智能工具筛选(12)

Tool Reduction 是 Microsoft.Extensions.AI 提供的中间件,通过语义相似度自动筛选工具,减少 Token 消耗,降低成本并提升模型准确率。它有效过滤无关工具,优化响应速度和调用准确性,适用于知识库和智能客服等场景。

.NET+AI | MEAI | 智能工具筛选(12)

dotNET跨平台
dotNET跨平台 · 2025-11-06T00:02:50Z

语义分块RAG方法通过计算句子间的语义相似度进行智能分块,从而提高检索精度。该方法利用百分位数等技术识别语义断点,将文本划分为连贯的块,并支持多种断点检测方式。

RAG系列-语义分块RAG(Semantic Chunking RAG)

Ethan's Blog
Ethan's Blog · 2025-06-17T16:00:00Z

本文提出了一种新方法GeAR,解决了传统文档检索中对语义相似度和细粒度语义关系的忽视。GeAR通过融合与解码模块生成相关文本,专注于细粒度信息,且无额外计算负担,展现出优越的检索性能。

生成增强检索:GeAR

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z

本文介绍了如何在Python中构建基本的重排序系统,以提高信息检索的相关性和准确性。通过定义文档类和重排序函数,结合用户查询的嵌入向量,计算文档的语义相似度和初始分数,最终生成排序后的文档列表。该系统可与检索增强生成(RAG)模型集成,优化用户响应。

如何在RAG中实现基本的重排序系统

KDnuggets
KDnuggets · 2024-11-11T17:00:10Z

该研究探讨了神经网络语言模型在计算俄语语义相似度中的应用,分析了不同模型的性能,并提出了新的评估资源和基准测试,以提升俄语自然语言处理的效果。

俄罗斯专注的嵌入模型探索:ruMTEB基准和俄语嵌入模型设计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

本文探讨了在科学文本分类中使用共引作为相似度度量的方法,结合领域特定微调和专家混合的通用适应性,显著提升了文本分类性能。同时,研究了预训练语言模型BERT的几何特征,提出了改进句子嵌入的方法,增强了语义文本相似度任务的表现。

电信领域句子嵌入的指南

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-18T00:00:00Z

本文探讨了余弦相似度在高维对象语义相似度量化中的表现,指出其可能导致无意义的相似度,建议谨慎使用并提出替代方法。同时比较了不同相似度计算方法的优缺点,强调基于排名的度量方法在聚类质量上的优势。

通过标准化的 ICA 转换嵌入重新审视余弦相似度

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-16T00:00:00Z

本文探讨了基于Transformer模型的语义相似度评估框架,分析了多种自然语言生成和问答系统的质量评估方法。研究发现,基于n-gram的机器翻译度量与人工评估一致性最高,而Word Mover Distance是有效的语义相似性测量方法。此外,提出了一种无监督质量估计方法,以提高机器翻译的质量评估效率。

机器翻译质量评估中的文本相似度作为关键指标

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

本文介绍了多种无监督学习方法,如弱监督自动摘要评估、结构感知负采样和对比学习,强调这些方法在文本表示和检索性能上的显著提升,尤其在语义相似度和开放领域问答中的应用效果。

基于教程的结构诱导负采样用于法定文件检索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-31T00:00:00Z

本文提出了一种用户可控机制,通过数值标签度量词汇重叠度和语义相似度,控制 LLM 对外部知识的依赖程度,实验证明该方法有效,强调了增强 LLM 的多功能性和准确性平衡的潜力。

学会拒绝:通过知识范围限制和拒绝机制提升大型语言模型的可控性和可靠性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-02T00:00:00Z
使用miniCOIL

miniCOIL是一个开源的稀疏神经检索模型,基于BM25公式并结合关键词的语义相似度进行评分,适用于根据关键词上下文进行排名的检索场景。与BM25相比,miniCOIL更好地捕捉关键词的语义,提供更相关的检索结果。在使用Qdrant进行设置和检索时,miniCOIL展现了其在理解关键词上下文方面的优势。

使用miniCOIL

Qdrant - Vector Database
Qdrant - Vector Database · 1970-01-01T08:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码