小红花·文摘 - 小红花技术领袖俱乐部

基于分支的语义代码搜索与Qdrant

基于分支的语义代码搜索与Qdrant

Qdrant - Vector Database ·

这个开源技能读2400页PDF token从450万降到2千

这个开源技能读2400页PDF token从450万降到2千

极道 ·

上下文窗口被打破：Subquadratic推出1200万tokens的窗口

上下文窗口被打破：Subquadratic推出1200万tokens的窗口

The New Stack ·

爆火GitHub！《生化危机》女主打造免费“AI记忆系统”

量子位 ·

Dropbox如何构建可扩展的企业知识搜索上下文引擎

Dropbox如何构建可扩展的企业知识搜索上下文引擎

InfoQ ·

RAG 教程笔记（Task03）

程序员充电站 ·

智能体上下文记忆框架MIRIX的简介

智能体上下文记忆框架MIRIX的简介

dotNET跨平台 ·

从“死记硬背“到“主动思考“：用 Microsoft Agent Framework 重新定义 RAG

从“死记硬背“到“主动思考“：用 Microsoft Agent Framework 重新定义 RAG

dotNET跨平台 ·

文章探讨了命题切块技术在AI信息检索中的应用，旨在将知识分解为独立、精确的小事实，从而提高检索效率和准确性。与传统的长段落检索相比，命题切块能够更快速、直接地回答用户问题，减少冗余信息，适用于多种场景。未来，该技术将推动AI问答系统的智能化和可信度提升。

让AI回答更“聪明精准”？你必须认识“命题切块”技术！（附实测详解、RAG新范式解析）

dotNET跨平台 ·

RAG（检索增强生成）系统通过上下文压缩技术提高检索效率和答案准确性。上下文压缩包括选择性保留、摘要和句子抽取三种方式，能有效减少无关信息。通过预处理、向量化、压缩和生成答案，RAG系统优化文档处理，节省内存并加快推理速度。

爆改RAG！用“上下文压缩”让你的AI检索系统又快又准

dotNET跨平台 ·

Uber Eats如何处理每日数十亿次搜索查询

Uber Eats如何处理每日数十亿次搜索查询

ByteByteGo Newsletter ·

本研究提出FreeKV框架，解决大型语言模型在处理长上下文时的关键值缓存检索效率低的问题。通过投机检索与系统优化，FreeKV在保持高精度的同时，提升了检索效率，实验显示速度提高了多达13倍。

FreeKV: Boosting KV Cache Retrieval for Efficient Large Language Model Inference

BriefGPT - AI 论文速递 ·

本研究提出了一种名为IKEA的自适应搜索代理，旨在提高大型语言模型的检索效率。该代理通过内部知识优先和创新的奖励函数，减少外部检索频率，从而提升准确性和推理能力。

Reinforced Internal-External Knowledge Synergistic Reasoning to Enhance the Efficiency of Adaptive Search Agents

BriefGPT - AI 论文速递 ·

演讲：优化Uber Eats的搜索

演讲：优化Uber Eats的搜索

InfoQ ·

Mixpeek如何利用Qdrant提升多模态特征存储的效率

Mixpeek如何利用Qdrant提升多模态特征存储的效率

Qdrant - Vector Database ·

本文提出生成检索与对齐模型（GRAM），旨在解决传统检索方法无法有效利用世界知识的问题。通过联合训练查询与产品文本，GRAM生成共享文本标识码，显著提升检索效率和查询产品之间的联系，优于传统及最新生成检索模型。

Generative Retrieval and Alignment Model: A New Paradigm for E-commerce Retrieval

BriefGPT - AI 论文速递 ·

信息检索中的相关反馈

Qdrant - Vector Database ·

理解RAG第七部分：向量数据库与索引策略

理解RAG第七部分：向量数据库与索引策略

MachineLearningMastery.com ·

跨模态检索：它为何对多模态人工智能至关重要

跨模态检索：它为何对多模态人工智能至关重要

The New Stack ·

本研究提出了一种基于生成信息检索的新方法，以解决电信网络智能自动化不足的问题。研究表明，Agentic上下文检索框架显著提升了电信规划中的答案准确性和检索效率，具有重要的实际应用潜力。

Towards Agentic AI: Intelligent Communication and Networking Driven by Generative Information Retrieval

BriefGPT - AI 论文速递 ·