小红花·文摘

通过利用大型语言模型（LLMs）从外部知识源获取相关信息，检索增强生成技术使LLMs适应特定领域并减少虚假数据。提出了一种名为ARL2的检索器学习技术，通过利用LLMs进行标注和评分，实现了从强大LLM监督中学习检索器，并使用自适应自训练策略筛选高质量和多样性的相关数据，降低了标注成本。实验证实了ARL2的有效性，在NQ上提高了5.4％，在MMLU上提高了4.6％，并展现了强大的迁移学习能力和零射击泛化能力。

RAR: 检索与排序增强型 MLLM 用于视觉识别

BriefGPT - AI 论文速递 ·

通过利用大型语言模型（LLMs）从外部知识源获取相关信息，检索增强生成技术使 LLMs 能够适应特定领域并减少在知识密集型任务中的虚假数据。提出了一种名为 ARL2 的检索器学习技术，通过利用 LLMs 进行标注和评分，实现了从强大 LLM 监督中学习检索器，并使用自适应自训练策略来筛选高质量和多样性的相关数据，有效降低了标注成本。实验证实了 ARL2 的有效性，在 NQ 上提高了 5.4％，在 MMLU 上提高了 4.6％，此外，ARL2 表现出强大的迁移学习能力和强大的零射击泛化能力。

ARL2：通过自导自适应相关标签对黑盒大语言模型进行对齐检索

BriefGPT - AI 论文速递 ·