小红花·文摘

CLaRa：通过连续潜在推理连接检索与生成

Apple Machine Learning Research ·

本文介绍了大语言模型（LLMs）的预训练和微调概念。预训练通过大量数据学习语言基础，而微调则是在此基础上针对特定任务进行适应。微调分为完全微调和参数高效微调（PEFT），后者更节省内存且风险较低。尽管微调有效，但并非唯一解决方案，改进提示或检索增强生成（RAG）有时更为合适。

微调入门解析（预训练模型如何学习新技能）

KDnuggets ·

检索增强生成（RAG）在与大型语言模型结合时存在检索无关和上下文污染等失败模式。常见的修复方法往往过度工程化，导致成本上升和准确性下降。可考虑使用长上下文提示、摘要检索、结构化检索和图形推理等替代方案，根据查询类型选择合适的架构，以提高准确性并降低成本。

使用Telnyx AI推理构建简单的检索增强生成（RAG）应用

mongona news ·

本文介绍了五篇关于大型语言模型（LLMs）的重要论文，涵盖其核心概念和技术。首先是“Attention Is All You Need”，提出了Transformer架构，强调自注意力机制。其次是GPT-3论文，展示了通过提示进行少量学习的能力。接着探讨了模型规模与性能的关系，分析大型模型为何更有效。然后是InstructGPT，讲述如何通过人类反馈优化模型以更好地遵循指令。最后介绍了检索增强生成（RAG），使模型能从外部获取信息以提高回答质量。这些论文为理解现代LLMs提供了基础。

五篇清晰解释大型语言模型的有趣论文

KDnuggets ·

上下文图：当最近邻搜索不足时

Redis Blog ·

简单易懂的RAG解析与实际项目

freeCodeCamp.org ·

代理检索技术：完整指南

Redis Blog ·

Antony Pegg：从托管PostgreSQL到生产RAG：在pgEdge云中构建您自己的Ellie

Planet PostgreSQL ·

谷歌扩展了Gemini API的文件搜索工具，支持多模态数据和自定义元数据，提升了检索增强生成系统的能力。新功能包括图像与文本的联合处理和页面引用，帮助用户更准确地找到信息并验证来源，使应用程序在处理大量数据时更高效、可靠。

Gemini API 文件搜索现已支持多模态：构建高效、可验证的检索增强生成系统

The Keyword ·

RAG重排序解析：更好的上下文，更好的答案

meilisearch blog ·

一文吃透Ollama Embeddings：概念、实操、避坑，助力RAG落地｜本地部署AI大模型必备

人言兑 ·

五种高效的长上下文检索增强生成技术

MachineLearningMastery.com ·

检索增强生成即服务：概念、应用案例、提供商及更多

meilisearch blog ·

提高检索增强生成（RAG）结果的五种重排序模型

MachineLearningMastery.com ·

减少大型语言模型中的幻觉问题可以通过七种策略实现：1. 使用检索增强生成（RAG）确保回答基于可靠数据；2. 关键声明需引用来源；3. 使用工具调用而非自由回答；4. 添加生成后验证步骤；5. 偏向引用而非改写；6. 校准不确定性并优雅失败；7. 持续评估和监控。这些方法有助于提高系统的可靠性和准确性。