图像语义和语法序列学习导向
原文中文,约300字,阅读约需1分钟。发表于: 。通过引入 “图像语法” 的概念,结合卷积神经网络和视觉变换器,我们提出了一个两阶段的弱监督学习方法,利用深度聚类和特征细化生成部分 - 语义分割,并结合双向长短时记忆模块处理语义分割补丁序列以捕捉图像语法,实现了对图像补丁损坏的准确检测,在多种语义和句法损坏场景中,验证了我们的框架在 Celeb 和 SUNRGBD 数据集上能够实现 70% 到 90% 的语法验证准确度。
通过引入图像语法概念,结合卷积神经网络和视觉变换器,提出了两阶段的弱监督学习方法,实现了对图像补丁损坏的准确检测。在Celeb和SUNRGBD数据集上,能够实现70%到90%的语法验证准确度。