小红花·文摘

本文提出了一种双流框架方法，结合多类关注区域模块（MCAR）和注视模型，以提高多类别目标识别和语义分割的准确性。该方法在多个数据集上表现优异，展示了深度学习在图像处理中的应用潜力。

多标签下的下水道管道缺陷识别：基于掩膜注意力特征增强和标签相关性学习

BriefGPT - AI 论文速递 ·

本文介绍了跨模态图像-文本检索的研究进展，涵盖特征提取、对齐和效率优化等方面。评估了2003至2016年的检索算法，并提出未来研究方向。研究了结合语音和图像的检索方法，提出了知识增强的双流框架KEDs，表现优于以往方法。此外，介绍了新数据集ReMuQ和Retriever模型ReViz，提升了多模态查询的检索效果。

远程感知影像的知识感知文本 - 影像检索

BriefGPT - AI 论文速递 ·

该研究提出了一个新的双流框架，利用Transformer和GNN架构学习空间和三维信息，并引入瓶颈Transformer以融合信息。实验证明该框架在事件分类上表现出最先进的性能。

基于大型视觉 - 语言模型的语义感知框架 - 事件融合式模式识别

BriefGPT - AI 论文速递 ·

该研究提出了一个新颖的双流框架，利用Transformer和结构化图神经网络（GNN）学习空间信息和三维立体信息，并引入瓶颈Transformer促进信息融合。实验证明该框架在事件分类上取得了最先进的性能。

基于学习瓶颈变换器的事件图像体素特征融合分类

BriefGPT - AI 论文速递 ·