FAMMA:金融领域多语言多模态问答的基准
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
通过外部工具增强语言模型可以减少金融领域的误差和幻觉。研究对 LLaMA-2 13B Chat 模型进行监督微调,使其成为“任务路由器”和“任务解决器”。使用金融问答数据集,模型 Raven 相比基准和基线模型分别提升了 35.2% 和 5.06%,并能与 GPT-3.5 竞争。这是首次在金融领域探索工具增强的研究。
🎯
关键要点
-
通过外部工具增强语言模型可减少金融领域的误差和幻觉。
-
对 LLaMA-2 13B Chat 模型进行监督微调,使其成为 '任务路由器' 和 '任务解决器'。
-
模型 Raven 在金融问答数据集上相比基准模型和基线模型分别提升了 35.2% 和 5.06%。
-
Raven 模型与 GPT-3.5 竞争效果良好。
-
这是首次在金融领域探索工具增强的研究。
➡️