TartuNLP在SemEval-2025任务5中的表现:将主题标签视为两阶段的信息检索
📝
内容提要
本研究针对SemEval-2025任务5,旨在帮助图书馆员为图书馆记录分配主题标签,通过文档内容从大型主题分类中检索相关标签。我们提出了一种双阶段的信息检索系统,使用双编码器进行粗粒度候选提取,同时利用交叉编码器进行细粒度重排序,显著提高了召回率,且在定性评估中表现出竞争力。
🏷️
标签
➡️