小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了五篇关于大型语言模型(LLMs)的重要论文,涵盖其核心概念和技术。首先是“Attention Is All You Need”,提出了Transformer架构,强调自注意力机制。其次是GPT-3论文,展示了通过提示进行少量学习的能力。接着探讨了模型规模与性能的关系,分析大型模型为何更有效。然后是InstructGPT,讲述如何通过人类反馈优化模型以更好地遵循指令。最后介绍了检索增强生成(RAG),使模型能从外部获取信息以提高回答质量。这些论文为理解现代LLMs提供了基础。

五篇清晰解释大型语言模型的有趣论文

KDnuggets
KDnuggets · 2026-06-03T12:00:14Z
上下文图:当最近邻搜索不足时

本文讨论了在检索增强生成(RAG)管道中,向量检索与上下文图的结合使用。向量检索在简单问题上表现良好,但在复杂问题上不足。上下文图通过结构化知识为实体和关系,能更有效地连接相关信息。双通道检索架构结合了两者的优点,提高了检索的准确性和效率。Redis提供了支持这一架构的工具,适用于构建上下文感知的AI基础设施。

上下文图:当最近邻搜索不足时

Redis Blog
Redis Blog · 2026-05-31T00:00:00Z
简单易懂的RAG解析与实际项目

RAG(检索增强生成)是一种架构,解决了传统大型语言模型无法访问私有数据的问题。它通过从数据库中检索相关信息来增强用户问题,并生成基于这些信息的答案。RAG的工作流程包括文档分块、嵌入、向量数据库和提示增强,确保AI能准确回答用户问题。理解RAG对软件工程师至关重要,因为现代企业软件几乎都涉及这一技术。

简单易懂的RAG解析与实际项目

freeCodeCamp.org
freeCodeCamp.org · 2026-05-28T16:17:22Z
代理检索技术:完整指南

文章讨论了“代理检索”的概念,强调其与传统检索增强生成(RAG)的不同。代理检索允许智能代理动态控制检索过程,通过迭代查询获取更准确的信息。Redis Iris被介绍为支持这一过程的上下文引擎,提供快速、实时的数据检索和缓存,确保代理在决策时拥有最新的上下文信息。

代理检索技术:完整指南

Redis Blog
Redis Blog · 2026-05-23T00:00:00Z
Antony Pegg:从托管PostgreSQL到生产RAG:在pgEdge云中构建您自己的Ellie

pgEdge推出的RAG服务器可实现24x7监控和管理Postgres数据库,支持检索增强生成。用户通过API发送查询,系统结合向量相似性和BM25关键词匹配,提供准确答案。RAG服务器可作为托管服务部署,支持多种嵌入和完成提供商,简化文档检索和管理流程,适用于合规和客户支持需求。

Antony Pegg:从托管PostgreSQL到生产RAG:在pgEdge云中构建您自己的Ellie

Planet PostgreSQL
Planet PostgreSQL · 2026-05-21T12:27:22Z

谷歌扩展了Gemini API的文件搜索工具,支持多模态数据和自定义元数据,提升了检索增强生成系统的能力。新功能包括图像与文本的联合处理和页面引用,帮助用户更准确地找到信息并验证来源,使应用程序在处理大量数据时更高效、可靠。

Gemini API 文件搜索现已支持多模态:构建高效、可验证的检索增强生成系统

The Keyword
The Keyword · 2026-05-05T18:00:00Z
RAG重排序解析:更好的上下文,更好的答案

RAG重排序是提升检索增强生成系统准确性和可靠性的关键。通过重新排序检索到的文档,确保语言模型获得相关信息,减少错误回答。重排序通过评估文档与用户查询的匹配度来优化结果。结合双编码器和交叉编码器的混合方法可以提高效率和准确性。Meilisearch是构建RAG系统的理想工具,提供快速检索和高质量结果。

RAG重排序解析:更好的上下文,更好的答案

meilisearch blog
meilisearch blog · 2026-05-05T00:00:00Z
一文吃透Ollama Embeddings:概念、实操、避坑,助力RAG落地|本地部署AI大模型必备

本文介绍了Ollama中的嵌入向量及其在检索增强生成中的应用。嵌入向量将文本转换为数值数组,以便计算语义相似度。文章探讨了嵌入向量的生成方法、应用场景(如搜索引擎、去重、推荐系统)以及常见问题和解决方案,帮助新手理解和应用该技术。

一文吃透Ollama Embeddings:概念、实操、避坑,助力RAG落地|本地部署AI大模型必备

人言兑
人言兑 · 2026-04-24T10:40:15Z
五种高效的长上下文检索增强生成技术

本文介绍了五种高效的长上下文检索增强生成(RAG)技术,旨在解决注意力限制和成本挑战。这些技术包括通过重新排序解决“中间丢失”问题、利用上下文缓存减少延迟和计算成本,以及结合元数据过滤和查询扩展提高相关性,从而构建可扩展且精准的RAG系统,确保模型关注最相关的信息。

五种高效的长上下文检索增强生成技术

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-15T12:00:40Z
检索增强生成即服务:概念、应用案例、提供商及更多

大型语言模型(LLMs)在信息不足时常出现错误回答。检索增强生成(RAG)通过连接外部数据来改善这一问题。RAG即服务(RAGaaS)为企业提供外部管理平台,使其无需深入了解向量数据库即可构建AI应用,简化数据接入、索引和检索过程,适用于客户支持聊天机器人和内部知识库等场景。选择自建RAG系统或使用RAGaaS取决于团队的专业知识和定制需求。

检索增强生成即服务:概念、应用案例、提供商及更多

meilisearch blog
meilisearch blog · 2026-04-07T00:00:00Z
提高检索增强生成(RAG)结果的五种重排序模型

本文介绍了五种重排序模型,以提高检索增强生成(RAG)系统的结果相关性。重排序在RAG流程中至关重要,通过评估候选项的相关性来优化最终答案。推荐的模型包括Qwen3-Reranker-4B、NVIDIA nv-rerankqa-mistral-4b-v3、Cohere rerank-v4.0-pro、jina-reranker-v3和BAAI bge-reranker-v2-m3。选择合适的重排序器时需考虑数据、延迟和成本等因素。

提高检索增强生成(RAG)结果的五种重排序模型

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-06T12:00:52Z

减少大型语言模型中的幻觉问题可以通过七种策略实现:1. 使用检索增强生成(RAG)确保回答基于可靠数据;2. 关键声明需引用来源;3. 使用工具调用而非自由回答;4. 添加生成后验证步骤;5. 偏向引用而非改写;6. 校准不确定性并优雅失败;7. 持续评估和监控。这些方法有助于提高系统的可靠性和准确性。

减少生产环境中大型语言模型幻觉的七种方法

KDnuggets
KDnuggets · 2026-03-18T12:00:21Z
企业响应中的检索增强生成:如何通过检索架构建立人工智能信任

大型语言模型(LLM)的表现依赖于输入上下文,缺乏实时企业数据可能导致错误回答。检索增强生成(RAG)通过在回答前检索相关信息,结合语言模型与外部知识库,确保回答基于最新的上下文,从而提升企业的信任度和响应质量。

企业响应中的检索增强生成:如何通过检索架构建立人工智能信任

Redis Blog
Redis Blog · 2026-03-01T00:00:00Z
利用大型语言模型增强人类标注,提高Dash搜索相关性

Dropbox Dash利用检索增强生成(RAG)模式,通过企业搜索获取相关信息并生成回答。它结合人类标注与大型语言模型(LLM)训练搜索排名模型,以提升搜索结果的相关性和质量。Dash通过自动化与人工审核相结合,确保生成的相关性标签准确且可扩展,从而优化搜索体验。

利用大型语言模型增强人类标注,提高Dash搜索相关性

Dropbox Tech Blog
Dropbox Tech Blog · 2026-02-26T17:00:00Z
通过检索增强生成和多目标对齐统一查询自动补全中的排名与生成

查询自动补全(QAC)是现代搜索系统的重要功能,但现有方法存在挑战。我们提出了一种统一框架,将QAC重构为端到端列表生成,结合检索增强生成(RAG)和多目标直接偏好优化(DPO),通过创新的多目标优化和混合服务架构,显著提升了搜索效率,并验证了其在生产中的有效性。

通过检索增强生成和多目标对齐统一查询自动补全中的排名与生成

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-18T00:00:00Z
提示工程与检索增强生成(RAG)与微调:为何这不是一条简单的阶梯

大语言模型(LLM)的定制应综合考虑提示工程、检索增强生成(RAG)和微调等不同方法,关注数据隐私、延迟、控制程度、更新频率、部署目标和成本六个维度。成功的架构需在这些维度之间取得平衡,确保系统在实际环境中有效运行,而非单纯依赖最新技术。

提示工程与检索增强生成(RAG)与微调:为何这不是一条简单的阶梯

The New Stack
The New Stack · 2026-01-29T18:00:51Z
如何使用检索增强生成与您的PDF进行对话

大型语言模型虽然能回答问题,但无法直接读取私密文档。检索增强生成(RAG)结合语言模型与用户数据,通过检索文档相关部分来提供答案。本文介绍如何使用LangChain构建后端和简单的React界面,实现与PDF的对话。RAG通过文档分块、生成向量嵌入并检索相关内容,确保答案基于真实数据,适用于处理公司政策和合同等文档。

如何使用检索增强生成与您的PDF进行对话

freeCodeCamp.org
freeCodeCamp.org · 2026-01-27T02:27:57Z
从统计学习到通用智能

文章探讨了人工智能的发展,特别是大语言模型(LLM)与向量数据库的结合。大模型通过深度学习和海量数据具备语言理解能力,能够处理复杂任务。检索增强生成(RAG)技术提升了模型的知识更新能力,而智能体(Agent)则赋予AI执行实际任务的能力。成功的关键在于问题的定义,而非仅仅掌握工具。

从统计学习到通用智能

Surmon.me
Surmon.me · 2026-01-18T16:04:04Z
通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

企业结合小型语言模型(SLM)与检索增强生成(RAG)架构,能有效降低基础设施成本,提高响应准确性和可审计性。SLM专注于特定领域,适合企业平台的可持续运行,而RAG通过引用权威数据源增强输出可信度。模块化代理架构使每个代理独立负责特定功能,便于扩展、治理,确保合规性和操作控制。

通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

The New Stack
The New Stack · 2026-01-10T18:00:27Z
开源检索基础设施可以弥补AI的生产差距

大型模型在早期受到关注,但企业工程团队面临挑战,模型规模的追求忽视了检索瓶颈,导致AI项目仍处于原型阶段。检索增强生成(RAG)通过真实数据提高准确性,解决了AI系统的幻觉问题。企业应重视检索基础设施,采用开源数据库以实现灵活定制,确保数据治理和透明度。RAG的普及为AI提供了可靠基础,推动企业向生产级AI系统发展。

开源检索基础设施可以弥补AI的生产差距

The New Stack
The New Stack · 2026-01-09T18:00:08Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码