FinanceBench: 金融问题回答的新基准

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

KnowledgeMath是评估LLMs在应用财务知识解决数学问题能力的基准,包含1,259个问题,需要大学水平的财务知识。提供了Python程序格式的专家解决方案。评估了14个LLMs,最佳系统准确率为45.4%。KnowledgeMath有助于领域特定知识检索和数学问题解决研究。基准和代码将在指定链接发布。

🎯

关键要点

  • KnowledgeMath是评估LLMs在应用财务知识解决数学问题能力的基准。
  • 该研究包含1,259个问题,需大学水平的财务知识。
  • 提供了Python程序格式的专家解决方案。
  • 评估了14个LLMs,最佳系统准确率为45.4%。
  • KnowledgeMath有助于领域特定知识检索和数学问题解决研究。
  • 基准和代码将在指定链接发布。
➡️

继续阅读