FAMMA:金融领域多语言多模态问答的基准

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

通过外部工具增强语言模型可以减少金融领域的误差和幻觉。研究对 LLaMA-2 13B Chat 模型进行监督微调,使其成为“任务路由器”和“任务解决器”。使用金融问答数据集,模型 Raven 相比基准和基线模型分别提升了 35.2% 和 5.06%,并能与 GPT-3.5 竞争。这是首次在金融领域探索工具增强的研究。

🎯

关键要点

  • 通过外部工具增强语言模型可减少金融领域的误差和幻觉。

  • 对 LLaMA-2 13B Chat 模型进行监督微调,使其成为 '任务路由器' 和 '任务解决器'。

  • 模型 Raven 在金融问答数据集上相比基准模型和基线模型分别提升了 35.2% 和 5.06%。

  • Raven 模型与 GPT-3.5 竞争效果良好。

  • 这是首次在金融领域探索工具增强的研究。

➡️

继续阅读