BriefGPT - AI 论文速递 ·

QAEA-DR：稠密检索统一文本增强框架

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了一种无需注释的可扩展伪查询文档训练方法，结合查询提取和生成，提升检索表现。研究开发了新型数据增强框架，利用多个预训练语言模型，显著提高了PrivacyQA基准测试的F1分数。同时，提出了基于大型语言模型的文档级嵌入框架，改进了检索模型的训练过程，并在多个数据集上取得了最新成果。

🎯

❓

QAEA-DR框架提出了一种无需注释的可扩展伪查询文档训练方法，结合查询提取和生成，显著提升了检索表现。

通过开发新型数据增强框架，利用多个预训练语言模型，研究在PrivacyQA基准测试中将F1分数提高了10%。

框架提出了基于大型语言模型的文档级嵌入框架，改进了负采样和损失函数等重要组件。

该框架在LoTTE和BEIR数据集上取得了最新的研究成果，显著提高了检索模型的效果。

该方法结合查询提取和生成，能够提升检索表现，且无需注释，具有可扩展性。

框架通过集成多个预训练语言模型，开发数据增强框架，以捕获未标记文本中的相关段落。

🏷️