CSPRD:中国股市金融政策检索数据集

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本研究提出政策检索任务,引入中文股票政策检索数据集(CSPRD),对700多个招股说明书文段进行标注。实验结果表明,CSPRD对于双编码模型是有效的,最佳基准模型在开发集上达到了56.1%的MRR@10,28.5%的NDCG@10,37.5%的Recall@10和80.6%的Precision@10。

🎯

关键要点

  • 本研究提出政策检索任务,旨在填补金融和经济领域缺乏高质量数据集的空白。
  • 引入中文股票政策检索数据集(CSPRD),对700多个招股说明书文段进行标注。
  • 实验结果表明,CSPRD对双编码模型是有效的。
  • 最佳基准模型在开发集上达到了56.1%的MRR@10,28.5%的NDCG@10,37.5%的Recall@10和80.6%的Precision@10。
  • 研究显示了进一步改进的潜力,尤其是在词汇、嵌入和微调模型方面。
➡️

继续阅读