小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
上下文窗口被打破:Subquadratic推出1200万tokens的窗口

Subquadratic公司推出了一种新模型,支持高达1200万tokens的上下文窗口,声称在检索效率上超越现有模型。其选择性注意力架构在计算和内存上实现线性扩展,速度比传统模型快52倍。公司计划未来推出5000万tokens的模型,并提供API和编码工具。尽管面临挑战,Subquadratic在多个基准测试中表现优异,吸引了投资者关注。

上下文窗口被打破:Subquadratic推出1200万tokens的窗口

The New Stack
The New Stack · 2026-05-05T18:01:04Z
爆火GitHub!《生化危机》女主打造免费“AI记忆系统”

《生化危机》女主米拉·乔沃维奇与程序员合作开发了开源AI记忆系统MemPalace,利用“记忆宫殿法”提高检索效率34%。该系统在长期记忆测试中表现优异,所有数据均在本地处理,确保隐私安全。

爆火GitHub!《生化危机》女主打造免费“AI记忆系统”

量子位
量子位 · 2026-04-09T05:11:19Z
Dropbox如何构建可扩展的企业知识搜索上下文引擎

Dropbox工程师介绍了Dropbox Dash的上下文引擎,强调基于索引的检索和知识图谱的应用。该系统通过内容预处理和知识图谱提升企业AI的检索效率,简化API调用。团队还利用语言模型评估检索质量,优化提示和排名逻辑,推动企业AI发展。

Dropbox如何构建可扩展的企业知识搜索上下文引擎

InfoQ
InfoQ · 2026-02-18T07:23:00Z
RAG 教程笔记(Task03)

向量嵌入技术将复杂数据转化为低维向量,提升检索质量。多模态嵌入实现跨模态对齐,打破数据类型壁垒。向量数据库高效管理和查询高维向量,支持AI应用。Milvus是开源的分布式向量数据库,适合大规模相似性搜索,通过优化索引提升检索精确性与效率。

RAG 教程笔记(Task03)

程序员充电站
程序员充电站 · 2025-12-25T08:54:47Z
智能体上下文记忆框架MIRIX的简介

MIRIX是一个基于大型语言模型的记忆系统框架,旨在跨会话保存用户交互信息,支持多模态输入。其记忆组件包括核心记忆、情节记忆和语义记忆,提升检索和响应效率。系统解析用户输入,推断主题,检索相关记忆并生成响应,同时更新记忆。使用时需注意时间限制,超过2小时可能导致响应延迟。

智能体上下文记忆框架MIRIX的简介

dotNET跨平台
dotNET跨平台 · 2025-12-01T00:02:24Z
从“死记硬背“到“主动思考“:用 Microsoft Agent Framework 重新定义 RAG

当RAG与Agent结合时,检索变得更加智能和灵活。传统的RAG检索方式较为死板,而Agentic RAG则具备自主决策、适应性和可组合性。Microsoft Agent Framework支持这种Agentic RAG,提供高效的检索工具和工作流,提升检索的效率与准确性。

从“死记硬背“到“主动思考“:用 Microsoft Agent Framework 重新定义 RAG

dotNET跨平台
dotNET跨平台 · 2025-11-12T00:01:33Z

文章探讨了命题切块技术在AI信息检索中的应用,旨在将知识分解为独立、精确的小事实,从而提高检索效率和准确性。与传统的长段落检索相比,命题切块能够更快速、直接地回答用户问题,减少冗余信息,适用于多种场景。未来,该技术将推动AI问答系统的智能化和可信度提升。

让AI回答更“聪明精准”?你必须认识“命题切块”技术!(附实测详解、RAG新范式解析)

dotNET跨平台
dotNET跨平台 · 2025-08-06T00:01:52Z

RAG(检索增强生成)系统通过上下文压缩技术提高检索效率和答案准确性。上下文压缩包括选择性保留、摘要和句子抽取三种方式,能有效减少无关信息。通过预处理、向量化、压缩和生成答案,RAG系统优化文档处理,节省内存并加快推理速度。

爆改RAG!用“上下文压缩”让你的AI检索系统又快又准

dotNET跨平台
dotNET跨平台 · 2025-07-01T00:04:57Z
Uber Eats如何处理每日数十亿次搜索查询

Uber Eats通过重构搜索平台,显著增加了商户数量,并解决了延迟、排名和一致性问题。采用多层架构优化文档处理,利用H3空间索引和ETA感知范围索引,提高了检索效率和用户体验。

Uber Eats如何处理每日数十亿次搜索查询

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-05-27T15:30:56Z

本研究提出FreeKV框架,解决大型语言模型在处理长上下文时的关键值缓存检索效率低的问题。通过投机检索与系统优化,FreeKV在保持高精度的同时,提升了检索效率,实验显示速度提高了多达13倍。

FreeKV: Boosting KV Cache Retrieval for Efficient Large Language Model Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种名为IKEA的自适应搜索代理,旨在提高大型语言模型的检索效率。该代理通过内部知识优先和创新的奖励函数,减少外部检索频率,从而提升准确性和推理能力。

Reinforced Internal-External Knowledge Synergistic Reasoning to Enhance the Efficiency of Adaptive Search Agents

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z
演讲:优化Uber Eats的搜索

Uber Eats团队讨论了扩展后端架构以满足更多商家和用户需求的重要性,强调选择多样性对用户体验的影响。他们介绍了技术挑战,如餐厅和杂货店接入、搜索优化及延迟问题,并通过改进数据布局和索引策略,成功降低了查询延迟,提高了检索效率。

演讲:优化Uber Eats的搜索

InfoQ
InfoQ · 2025-04-25T09:23:00Z
Mixpeek如何利用Qdrant提升多模态特征存储的效率

Mixpeek是一种多模态数据处理平台,利用Qdrant作为特征存储,提升检索效率。Qdrant支持多向量索引,使混合检索器的实现更简便,查询速度提高40%。迁移后,Mixpeek在特征提取和文档聚类方面显著改进,支持复杂的多模态用例。

Mixpeek如何利用Qdrant提升多模态特征存储的效率

Qdrant - Vector Database
Qdrant - Vector Database · 2025-04-08T00:00:00Z

本文提出生成检索与对齐模型(GRAM),旨在解决传统检索方法无法有效利用世界知识的问题。通过联合训练查询与产品文本,GRAM生成共享文本标识码,显著提升检索效率和查询产品之间的联系,优于传统及最新生成检索模型。

Generative Retrieval and Alignment Model: A New Paradigm for E-commerce Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z
信息检索中的相关反馈

相关反馈是提升信息检索效果的重要机制。尽管相关反馈在研究中得到广泛探讨,但在实际向量搜索中应用仍然有限。文章分析了伪相关反馈和二元相关反馈等方法,并指出这些方法在工业界的应用不足。有效的相关反馈应直接集成到检索系统中,以改善用户体验和检索效率。

信息检索中的相关反馈

Qdrant - Vector Database
Qdrant - Vector Database · 2025-03-26T21:00:00Z
理解RAG第七部分:向量数据库与索引策略

本文探讨了向量数据库和索引策略在RAG系统中的重要性。向量数据库通过相似性搜索优化文本存储和检索,快速获取相关信息。近似最近邻(ANN)和倒排文件索引(IVF)等索引策略提高了检索效率和准确性。这些概念的理解有助于设计高效的RAG系统,提升响应速度和质量。

理解RAG第七部分:向量数据库与索引策略

MachineLearningMastery.com
MachineLearningMastery.com · 2025-03-12T12:55:45Z
跨模态检索:它为何对多模态人工智能至关重要

多模态人工智能近年来受到关注,主要涉及文本、图像和音频等多种数据的处理。跨模态检索旨在提取不同数据中的相关信息,但由于数据结构差异面临挑战。通过表示学习,机器能够将多模态数据简化为可理解的模式,从而提高检索效率。解决跨模态检索中的问题将有助于提升搜索结果的准确性和相关性。

跨模态检索:它为何对多模态人工智能至关重要

The New Stack
The New Stack · 2025-03-03T14:30:08Z

本研究提出了一种基于生成信息检索的新方法,以解决电信网络智能自动化不足的问题。研究表明,Agentic上下文检索框架显著提升了电信规划中的答案准确性和检索效率,具有重要的实际应用潜力。

Towards Agentic AI: Intelligent Communication and Networking Driven by Generative Information Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z

本研究提出了一种名为Segment-Proposal-Ranking (SPR)的视频时刻搜索框架,旨在提高检索效率和准确性。该框架将搜索过程分为三个独立阶段,适用于任何长度的视频。实验结果表明,SPR在降低计算成本和处理时间的同时,保持了高性能,适合大规模应用。

A Flexible and Scalable Framework for Video Moment Search

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本文提出了一种新型语义搜索算法,结合Word2Vec和Annoy索引,显著提高了在大数据集中检索信息的效率,尤其在处理高达100GB的数据集时,表现出高精度和优良性能。

语义搜索与推荐算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码