本研究提出了一种推理调优方法,通过将检索数据与自然语言推理数据结合,解决稠密段落检索中的相关性评分问题,显著提升检索性能,并能与现有方法结合使用。
SimLM是一种用于稠密段落检索的预训练方法,通过瓶颈架构将段落信息压缩成密集向量,并使用替换的语言建模目标来提高样本效率。实验证明,SimLM在多个大规模段落检索数据集上比强基线和ColBERTv2等方法都有显著改进。
完成下面两步后,将自动完成登录并继续当前操作。