小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
HNSW与LSH:Elasticsearch如何在每秒15,000个查询下实现0.99的召回率@10——以及其成本

Elasticsearch使用HNSW算法在每秒15,000个查询下实现0.99的召回率@10。通过量化技术,DiskBBQ在55,000 QPS下达到0.97的召回率,内存占用减少8倍。HNSW通过多层图结构提高查询效率,适合高维数据的近似最近邻搜索。量化方法如标量量化和产品量化进一步压缩内存,提升性能。

HNSW与LSH:Elasticsearch如何在每秒15,000个查询下实现0.99的召回率@10——以及其成本

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2026-06-09T00:00:00Z
高精度重建完全遮挡物体,MIT团队利用生成式AI改进无线视觉系统,最高精度达85%

麻省理工学院研究人员提出Wave-Former方法,利用毫米波技术实现高精度三维重建,成功克服传统视觉模型的局限,召回率从54%提升至72%,精度保持在85%。研究成果已发布于arXiv。

高精度重建完全遮挡物体,MIT团队利用生成式AI改进无线视觉系统,最高精度达85%

HyperAI超神经
HyperAI超神经 · 2026-03-26T04:50:13Z
基于jina-reranker-m0的多模态文档公平评分

构建体育新闻搜索系统时,处理文本与图像的相关性问题。提出了两阶段检索流程:首先使用jina-clip-v2获取候选文档,然后用jina-reranker-m0进行统一排序,从而提升检索效果,最终实现62%的召回率提升。

基于jina-reranker-m0的多模态文档公平评分

Jina AI
Jina AI · 2025-05-25T06:25:10Z
机器学习中的精确率与召回率

精确率和召回率是评估分类模型性能的关键指标。精确率衡量预测为正的项目中正确的比例,适用于垃圾邮件检测和医疗诊断;召回率衡量实际正例的识别数量,适用于疾病和欺诈检测。两者共同优化模型的准确性和覆盖率。

机器学习中的精确率与召回率

DEV Community
DEV Community · 2025-05-24T06:03:03Z

本研究利用基于变换器的自然语言处理系统,成功从美国法典中自动提取法定义,精确率达到96.8%,召回率为98.9%。该技术显著提升了法律信息的可及性和理解力。

Transformer-Based Extraction of Statutory Definitions from the U.S. Code

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z
为AI应用打造高效的准确性指标

评估AI应用的准确性指标,如精确度、召回率和F1分数,是理解模型表现的关键。通过使用标记数据集进行测试,可以优化API提取器的性能,并平衡精确度与召回率,以减少错误标记和漏标真实端点。

为AI应用打造高效的准确性指标

DEV Community
DEV Community · 2025-04-18T17:23:44Z

本研究提出了WebLists基准,涵盖200个数据提取任务,展示了现有大型语言模型和网页代理的局限性。通过BardeenAgent框架,实现了66%的召回率,显著提升了网页数据提取的效率和准确性。

WebLists: Extracting Structured Information from Complex Interactive Websites Using Executable LLM Agents

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z
Elasticsearch 9.0 和 8.18:为开发者精心打造,提供更快的BBQ——速度比OpenSearch快5倍

Elasticsearch 9.0和8.18版本发布,提供更快的BBQ(更好的二进制量化),速度比OpenSearch快5倍。新算法提升了召回率和吞吐量,支持多种语义搜索模型,简化API,改善开发者体验。

Elasticsearch 9.0 和 8.18:为开发者精心打造,提供更快的BBQ——速度比OpenSearch快5倍

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2025-04-14T22:00:00Z

MicroNN是一种在低资源环境中进行设备端向量搜索的数据库,支持实时更新和混合搜索查询。它在受限内存下高效运行,能在7毫秒内检索前100个最近邻,召回率达到90%。

MicroNN: An Updatable Disk-resident Vector Database for On-device Use

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z

Llama-4在长上下文处理上表现不佳,召回率低于60%。Fiction.LiveBench测试显示其在理解复杂关系和逻辑预测方面存在困难。RAG(检索增强生成)因精准性和实时性成为更优选择。未来结合大模型与RAG的优势,将更有效解决业务问题。

LLM有了大上下文,还需要RAG么? - 蝈蝈俊

蝈蝈俊
蝈蝈俊 · 2025-04-07T06:02:00Z
利用数据挖掘技术分析SMS垃圾信息数据集中的模式

垃圾信息在现代通信中持续存在。本文利用SMS垃圾信息数据集,通过数据挖掘技术分析和预测垃圾信息模式。采用逻辑回归进行分类,K均值聚类探索数据结构。结果显示,逻辑回归的准确率为89%,但召回率较低,表明模型在识别垃圾信息时存在漏检。未来可通过集成方法和深度学习提高召回率。

利用数据挖掘技术分析SMS垃圾信息数据集中的模式

DEV Community
DEV Community · 2025-03-15T12:18:55Z
北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

北京大学彭宇新教授团队研究了多轮组合图像检索,提出FashionMT数据集和MAI模型,解决了历史上下文缺失和数据规模限制的问题。实验结果显示,MAI在FashionMT基准上的召回率提升了8%,有效优化了多模态检索性能。

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

机器之心
机器之心 · 2025-03-04T05:19:23Z
分类指标:为何及何时使用它们

分类模型的性能评估需根据具体问题选择指标,主要包括准确率、精确率、召回率、F1分数、ROC-AUC和对数损失。选择合适的指标时需考虑数据的平衡性及错误类型的成本。

分类指标:为何及何时使用它们

DEV Community
DEV Community · 2025-03-01T11:07:52Z
【大模型】评测指标解析(准确率/精确率/召回率/F1分数/rouge/Perplexity/BLEU)

准确率是评估分类模型性能的重要指标,计算公式为Accuracy=(TP+TN)/(TP+TN+FP+FN)。精确率和召回率分别衡量模型对正类的预测准确性和覆盖程度。F1分数综合评估精确率和召回率,适用于类别不平衡的数据集。ROUGE和BLEU用于评估文本摘要和机器翻译的质量。

【大模型】评测指标解析(准确率/精确率/召回率/F1分数/rouge/Perplexity/BLEU)

同和故事匯
同和故事匯 · 2025-02-19T03:46:33Z
比较秘密检测解决方案?为什么您应该使用F1分数

随着DevOps实践的普及,对可靠的秘密检测解决方案的需求增加。F1分数被认为是评估工具性能的最佳指标,它通过平衡召回率和精确率来提供全面评估。高召回率可能导致假阳性,而高精确率可能漏掉重要秘密,因此找到两者之间的平衡至关重要。F1分数是比较解决方案的有效方式。

比较秘密检测解决方案?为什么您应该使用F1分数

DEV Community
DEV Community · 2025-02-03T15:25:54Z

中科院院士鄂维南与字节跳动AI实验室总监李航推出了高级论文搜索工具PaSa,显著提升了学术搜索的召回率和精准性,超越谷歌学术等平台。该系统通过两个Agent进行多轮搜索和论文评估,用户只需输入研究主题即可快速获取相关论文及摘要,极大提高文献检索效率。

鄂维南李航领衔造高级论文搜索Agent,召回率和精准性超谷歌学术等,磕盐党狂喜

量子位
量子位 · 2025-01-26T08:22:10Z

本研究提出了一种增强的提取器-选择器框架,改善了边缘检测中的特征选择机制,并引入了对称加权二元交叉熵损失函数,显著提高了边缘像素的召回率和预测准确性,设立了新基准,具有重要应用潜力。

增强提取器-选择器框架及对称加权二元交叉熵用于边缘检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究提出了一种基于先验引导的稀疏专家混合方法,旨在解决点云配准中的重叠区域模糊结构问题。实验结果显示,该方法在3DMatch和3DLoMatch基准测试中分别达到了95.7%和79.3%的配准召回率。

PSReg: Prior-Guided Sparse Mixture of Experts for Point Cloud Registration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究提出了一种新框架,通过对ItemID进行语义对齐和引入监督学习任务,解决推荐系统中稀疏语义与大型语言模型之间的差异。实验结果表明,该模型显著提高了召回率,并增强了推荐系统的扩展性。

Semantic Convergence: Harmonizing Recommender Systems through Two-Stage Alignment and Behavioral Semantic Tokenization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究探讨自然语言处理(NLP)在自动提取文学角色网络中的应用,重点分析命名实体识别(NER)和共指解析的作用。研究结果表明,NER的性能显著影响角色检测,单独使用NER可能会遗漏角色共现,因此需要依赖共指解析进行补救。此外,传统NLP管道在召回率上优于基于大型语言模型的方法。

自然语言处理任务在自动文学角色网络构建中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码