ZeroMamba:探索零样本学习的视觉状态空间模型

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文探讨了零样本学习中的交叉域匹配问题,并提出了一种基于分支网络的方法来映射语义描述和视觉样本到joint空间,实现跨未知类别输入的优化过程。同时,还解决了ZSL中的模型偏差问题,取得了卓越的性能。

🎯

关键要点

  • 本文探讨零样本学习中的交叉域匹配问题。

  • 优秀的embedding空间应满足类内紧度和类间可分性两个标准。

  • 提出了一种基于两个分支网络的方法来映射语义描述和视觉样本到joint空间。

  • 强制要求视觉嵌入与类级语义嵌入相同,区分可训练分类器。

  • 实现跨未知类别输入的优化过程。

  • 扩展方法以处理ZSL中的模型偏差问题。

  • 在五个标准数据集上取得了卓越的性能。

➡️

继续阅读