CLIM:用于区域表示的对比性语言 - 图像拼贴
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究提出了一种新型的开放词汇目标检测框架,通过自然语言监督学习从配对的图像文本数据中直接学习。实验结果显示,在基准数据集上取得了卓越性能。
🎯
关键要点
- 提出了一种新型的开放词汇目标检测框架。
- 该框架通过自然语言监督学习从配对的图像文本数据中直接学习。
- 将对象 - 语言对齐形式化为图像区域特征集合和词向量集合之间的集合匹配问题。
- 该方法可以更简单和有效地训练开放词汇对象探测器。
- 在两个基准数据集上进行了广泛的实验。
- 在 LVIS 等新类别上实现了 32.0%的 mAP 和 21.7%的掩膜 mAP 的卓越性能。
🏷️
标签
➡️