CICA:零样本文档图像分类中的内容注入对齐

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文提出了一种方法和评价,用于在零样本学习和广义零样本学习环境中对文档图像分类进行全面分析。通过引入一种全新的 ' 内容模块 ',可以提升 CLIP 的零样本学习能力,提高了准确率和调和平均值。这项工作为零样本文档分类的未来研究指明了方向。

🎯

关键要点

  • 提出了一种方法和评价,用于文档图像分类的零样本学习和广义零样本学习。
  • 适用于 RVL-CDIP 数据集的零样本划分和 CICA 框架被引入。
  • 新引入的 ' 内容模块 ' 提升了 CLIP 的零样本学习能力。
  • CICA 模块仅增加了 CLIP 的 3.3% 参数。
  • ZSL 的 Top-1 准确率提高了 6.7%。
  • GZSL 的调和平均值提高了 24%。
  • 这项工作为零样本文档分类的未来研究指明了方向。
➡️

继续阅读