小红花·文摘

使用NDCG@K和Redis评估信息检索

Redis Blog ·

本研究提出序列偏好优化方法，利用NDCG解决大型语言模型与人类多样化偏好的对齐问题。结果显示，OPO在评估和基准测试中优于现有方法，并通过增加负样本池提升性能。

序列偏好优化：通过NDCG对齐人类偏好

BriefGPT - AI 论文速递 ·

本研究提出政策检索任务，引入中文股票政策检索数据集(CSPRD)，对700多个招股说明书文段进行标注。实验结果表明，CSPRD对于双编码模型是有效的，最佳基准模型在开发集上达到了56.1％的MRR@10，28.5％的NDCG@10，37.5％的Recall@10和80.6％的Precision@10。

CSPRD：中国股市金融政策检索数据集

BriefGPT - AI 论文速递 ·