一个多模态多语言文件图像分类基准
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究介绍了两个新的多语言数据集,用于文档图像分类任务。研究对文档智能模型进行了全面研究,包括多标签分类和零样本跨语言迁移设置。实验结果显示多语言文档智能模型在跨语言迁移上存在局限性。
🎯
关键要点
- 文档图像分类与纯文本文档分类不同,涉及理解文档内容和结构。
- 本研究介绍了两个新的多语言数据集:WIKI-DOC 和 MULTIEURLEX-DOC。
- 新数据集旨在克服现有数据集的限制。
- 研究对文档智能模型进行了全面研究,包括多标签分类和零样本跨语言迁移设置。
- 实验结果表明,多语言文档智能模型在跨语言迁移上存在局限性。
- 研究结果为未来改进文档智能模型提供了新的方向。
➡️