小红花·文摘 - 小红花技术领袖俱乐部

HNSW与LSH：Elasticsearch如何在每秒15,000个查询下实现0.99的召回率@10——以及其成本

HNSW与LSH：Elasticsearch如何在每秒15,000个查询下实现0.99的召回率@10——以及其成本

Elastic Blog - Elasticsearch, Kibana, and ELK Stack ·

高精度重建完全遮挡物体，MIT团队利用生成式AI改进无线视觉系统，最高精度达85%

高精度重建完全遮挡物体，MIT团队利用生成式AI改进无线视觉系统，最高精度达85%

HyperAI超神经 ·

基于jina-reranker-m0的多模态文档公平评分

基于jina-reranker-m0的多模态文档公平评分

Jina AI ·

机器学习中的精确率与召回率

机器学习中的精确率与召回率

DEV Community ·

本研究利用基于变换器的自然语言处理系统，成功从美国法典中自动提取法定义，精确率达到96.8%，召回率为98.9%。该技术显著提升了法律信息的可及性和理解力。

Transformer-Based Extraction of Statutory Definitions from the U.S. Code

BriefGPT - AI 论文速递 ·

为AI应用打造高效的准确性指标

为AI应用打造高效的准确性指标

DEV Community ·

本研究提出了WebLists基准，涵盖200个数据提取任务，展示了现有大型语言模型和网页代理的局限性。通过BardeenAgent框架，实现了66%的召回率，显著提升了网页数据提取的效率和准确性。

WebLists: Extracting Structured Information from Complex Interactive Websites Using Executable LLM Agents

BriefGPT - AI 论文速递 ·

Elasticsearch 9.0 和 8.18：为开发者精心打造，提供更快的BBQ——速度比OpenSearch快5倍

Elasticsearch 9.0 和 8.18：为开发者精心打造，提供更快的BBQ——速度比OpenSearch快5倍

Elastic Blog - Elasticsearch, Kibana, and ELK Stack ·

MicroNN是一种在低资源环境中进行设备端向量搜索的数据库，支持实时更新和混合搜索查询。它在受限内存下高效运行，能在7毫秒内检索前100个最近邻，召回率达到90%。

MicroNN: An Updatable Disk-resident Vector Database for On-device Use

BriefGPT - AI 论文速递 ·

Llama-4在长上下文处理上表现不佳，召回率低于60%。Fiction.LiveBench测试显示其在理解复杂关系和逻辑预测方面存在困难。RAG（检索增强生成）因精准性和实时性成为更优选择。未来结合大模型与RAG的优势，将更有效解决业务问题。

LLM有了大上下文，还需要RAG么？ - 蝈蝈俊

蝈蝈俊 ·

利用数据挖掘技术分析SMS垃圾信息数据集中的模式

利用数据挖掘技术分析SMS垃圾信息数据集中的模式

DEV Community ·

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

机器之心 ·

分类指标：为何及何时使用它们

分类指标：为何及何时使用它们

DEV Community ·

【大模型】评测指标解析（准确率/精确率/召回率/F1分数/rouge/Perplexity/BLEU）

【大模型】评测指标解析（准确率/精确率/召回率/F1分数/rouge/Perplexity/BLEU）

同和故事匯 ·

比较秘密检测解决方案？为什么您应该使用F1分数

比较秘密检测解决方案？为什么您应该使用F1分数

DEV Community ·

中科院院士鄂维南与字节跳动AI实验室总监李航推出了高级论文搜索工具PaSa，显著提升了学术搜索的召回率和精准性，超越谷歌学术等平台。该系统通过两个Agent进行多轮搜索和论文评估，用户只需输入研究主题即可快速获取相关论文及摘要，极大提高文献检索效率。

鄂维南李航领衔造高级论文搜索Agent，召回率和精准性超谷歌学术等，磕盐党狂喜

量子位 ·

本研究提出了一种增强的提取器-选择器框架，改善了边缘检测中的特征选择机制，并引入了对称加权二元交叉熵损失函数，显著提高了边缘像素的召回率和预测准确性，设立了新基准，具有重要应用潜力。

增强提取器-选择器框架及对称加权二元交叉熵用于边缘检测

BriefGPT - AI 论文速递 ·

本研究提出了一种基于先验引导的稀疏专家混合方法，旨在解决点云配准中的重叠区域模糊结构问题。实验结果显示，该方法在3DMatch和3DLoMatch基准测试中分别达到了95.7%和79.3%的配准召回率。

PSReg: Prior-Guided Sparse Mixture of Experts for Point Cloud Registration

BriefGPT - AI 论文速递 ·

本研究提出了一种新框架，通过对ItemID进行语义对齐和引入监督学习任务，解决推荐系统中稀疏语义与大型语言模型之间的差异。实验结果表明，该模型显著提高了召回率，并增强了推荐系统的扩展性。

Semantic Convergence: Harmonizing Recommender Systems through Two-Stage Alignment and Behavioral Semantic Tokenization

BriefGPT - AI 论文速递 ·

本研究探讨自然语言处理(NLP)在自动提取文学角色网络中的应用，重点分析命名实体识别(NER)和共指解析的作用。研究结果表明，NER的性能显著影响角色检测，单独使用NER可能会遗漏角色共现，因此需要依赖共指解析进行补救。此外，传统NLP管道在召回率上优于基于大型语言模型的方法。

自然语言处理任务在自动文学角色网络构建中的作用

BriefGPT - AI 论文速递 ·