CSPRD:中国股市金融政策检索数据集
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本研究提出政策检索任务,引入中文股票政策检索数据集(CSPRD),对700多个招股说明书文段进行标注。实验结果表明,CSPRD对于双编码模型是有效的,最佳基准模型在开发集上达到了56.1%的MRR@10,28.5%的NDCG@10,37.5%的Recall@10和80.6%的Precision@10。
🎯
关键要点
- 本研究提出政策检索任务,旨在填补金融和经济领域缺乏高质量数据集的空白。
- 引入中文股票政策检索数据集(CSPRD),对700多个招股说明书文段进行标注。
- 实验结果表明,CSPRD对双编码模型是有效的。
- 最佳基准模型在开发集上达到了56.1%的MRR@10,28.5%的NDCG@10,37.5%的Recall@10和80.6%的Precision@10。
- 研究显示了进一步改进的潜力,尤其是在词汇、嵌入和微调模型方面。
➡️