上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

💡 原文中文,约4500字,阅读约需11分钟。
📝

内容提要

上海财经大学团队发布了金融大语言模型Fin-R1,参数为7B,性能超越同规模模型,平均得分75.2,接近671B的DeepSeek-R1。该模型通过构建60k条高质量金融推理数据集,并结合指令微调和强化学习,提升了金融领域的推理能力,展现出卓越的适应能力。

🎯

关键要点

  • 上海财经大学发布金融大语言模型Fin-R1,参数为7B,性能超越同规模模型,平均得分75.2。
  • Fin-R1通过构建60k条高质量金融推理数据集,结合指令微调和强化学习,提升金融领域的推理能力。
  • 该模型展示了卓越的适应能力,接近671B的DeepSeek-R1。
  • 项目由张立文教授及其团队完成,标志着高校在金融科技领域的自主创新迈入新高度。
  • Fin-R1的训练框架包括数据构建、模型训练和性能验证,形成完整的技术闭环。
  • 模型在金融推理任务中展现出强大的处理能力,尤其在真实金融表格数值推理和多轮交互场景中表现优异。
  • Fin-R1的开源和低计算资源需求使其适用于各种金融场景,用户可快速部署。

延伸问答

Fin-R1模型的参数规模是多少?

Fin-R1模型的参数规模为7B。

Fin-R1模型的性能如何?

Fin-R1模型在评测中平均得分为75.2,超越同规模模型,接近671B的DeepSeek-R1。

Fin-R1是如何提升金融推理能力的?

Fin-R1通过构建60k条高质量金融推理数据集,并结合指令微调和强化学习来提升推理能力。

Fin-R1模型适用于哪些金融场景?

Fin-R1适用于银行、证券、信托等多个金融核心业务场景。

Fin-R1的开源特性有什么优势?

Fin-R1的开源和低计算资源需求使其能够在个人电脑上轻松部署,适用于各种金融场景。

Fin-R1模型的训练框架是什么样的?

Fin-R1的训练框架包括数据构建、模型训练和性能验证,形成完整的技术闭环。

➡️

继续阅读