💡
原文日文,约3400字,阅读约需8分钟。
📝
内容提要
2025年,ByteDance Research推出了基于强化学习的论文检索智能体PaSa,用户只需提出学术问题,PaSa即可快速检索相关论文,显著提升调研效率。与主流工具相比,PaSa在召回率和准确率上均有显著提高,现已开放试用并提供开源数据和代码。
🎯
关键要点
- 2025年,ByteDance Research推出了基于强化学习的论文检索智能体PaSa。
- PaSa能够快速检索相关论文,显著提升调研效率,用户只需提出学术问题。
- 与主流工具相比,PaSa在召回率和准确率上均有显著提高。
- PaSa已开放试用,并提供开源数据和代码。
- PaSa的核心组件包括Crawler和Selector,分别负责收集和筛选相关论文。
- 研究团队构建了高质量的学术细粒度Query数据集AutoScholarQuery用于训练PaSa。
- PaSa在真实学术搜索场景中的表现优于多个基线模型,包括Google和ChatGPT。
- 在AutoScholarQuery测试集上,PaSa-7b的召回率和准确率均优于其他模型。
- PaSa的设计旨在应对学术搜索中的独特挑战,支持全面的召回能力和细粒度查询。
➡️