多模态银行数据集:通过事件序列理解客户需求
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了金融组织缺乏大规模公开多模态事件序列数据集的问题。提出的工业级公开多模态银行数据集MBD,包含超过150万企业客户的950M银行交易和其他多种模态数据,提供了新的基准和两个业务任务,有助于推动多模态算法在事件序列研究中的应用。该数据集的使用证明了多模态技术在预测和客户匹配中的优越性,具有重要的研究和应用价值。
本研究探讨多模态模型在银行业提升效率和应对金融科技竞争的潜力。通过分析银行文件,展示自动化和高级分析技术的应用。LayoutXLM模型在文本标记分类中表现优异,F1得分约80%,仅用30%训练数据即可达75%得分,显示其高效性。研究强调布局和图像信息的重要性,展示多模态模型在银行业务中的实际应用和优势。