小红花·文摘

基于层次记忆的预训练：区分长尾知识与常识

Apple Machine Learning Research ·

本研究提出了自适应检索增强生成法（ARAG），旨在提高源信息的效率和相关性。研究者创建了基准测试集RetrievalQA，包含1,271个关于新颖领域和长尾知识的问题。他们还提出了简单而有效的方法TA-ARE，用于评估语言模型中检索的必要性。

多样化-验证-适应：高效且稳健的检索增强模糊问题回答

BriefGPT - AI 论文速递 ·

本研究发现，提供知识图谱三元组可以显著提高语言模型性能，特别是在需要长尾知识的情况下。同时，提供知识图谱和文本可以减少生成内容中的幻觉。

基于辨别指导的知识图谱补全的生成式大型语言模型微调

BriefGPT - AI 论文速递 ·

当我谈RAG时我谈些什么

Fatescript ·

本文研究了大型语言模型记忆的知识与预训练数据中信息之间的关系。结果发现，语言模型回答基于事实的问题的能力与预训练期间看到的相关问题文档数量有强相关性和因果关系。同时，更大的模型能学习更长尾的知识，但需要将模型规模增加数个数量级才能在缺乏支持数据的问题上实现具有竞争性的问答表现。最后，对相关文档数量依赖进行检索增强，能够有效捕捉长尾知识。

大型语言模型能准确预测搜索者偏好

BriefGPT - AI 论文速递 ·