ZeroMamba:探索零样本学习的视觉状态空间模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文探讨了零样本学习中的交叉域匹配问题,并提出了一种基于分支网络的方法来映射语义描述和视觉样本到joint空间,实现跨未知类别输入的优化过程。同时,还解决了ZSL中的模型偏差问题,取得了卓越的性能。
🎯
关键要点
-
本文探讨零样本学习中的交叉域匹配问题。
-
优秀的embedding空间应满足类内紧度和类间可分性两个标准。
-
提出了一种基于两个分支网络的方法来映射语义描述和视觉样本到joint空间。
-
强制要求视觉嵌入与类级语义嵌入相同,区分可训练分类器。
-
实现跨未知类别输入的优化过程。
-
扩展方法以处理ZSL中的模型偏差问题。
-
在五个标准数据集上取得了卓越的性能。
➡️