小红花·文摘

本研究提出了Seg2HOI框架，结合视觉模型与人机交互任务，能够有效生成分割掩膜的四元组，其性能与先进方法相当，具有良好的应用潜力。

基于基础模型的人机交互预测框架与分割掩膜集成

BriefGPT - AI 论文速递 ·

本研究提出了MedSegFactory框架，旨在解决医学图像和分割掩膜生成中的数据稀缺问题。该框架结合双流扩散模型和交叉注意机制，生成高质量的图像-掩膜配对，显著提高了一致性和可靠性。实验结果显示，MedSegFactory在2D和3D分割任务中表现优越，提升了医学成像的效率和准确性。

MedSegFactory：文本指导的医学图像-掩膜对生成

BriefGPT - AI 论文速递 ·

本研究解决了遥感图像变化描述领域中以往方法对特定网络架构的过度依赖和较差的泛化能力的问题。通过提出一种结合扩散模型的新方法，转变了传统特征学习范式为数据分布学习，进而提升了变化检测和描述的准确性。实验结果表明，该方法在多个遥感变化检测描述数据集上表现优越，具有良好的应用潜力。

掩膜近似网络：融合特征提取与分布学习的遥感变化描述

BriefGPT - AI 论文速递 ·

本研究提出了一种新的视频模型MV-CC，旨在简化遥感图像变化描述中的特征提取，实验结果显示该模型性能优于其他先进方法。

MV-CC: 遥感变化描述的掩膜增强视频模型

BriefGPT - AI 论文速递 ·

本文评估了基于Segment Anything Model (SAM)的医学图像分割能力，发现其在CT数据上表现良好，但在结构性目标上存在局限。通过适当提示，SAM的性能显著提升。研究还提出了新模型和方法，展示了在肿瘤分割和病理学任务中的潜力。

释放视觉-语言预训练在3D零样本病变分割中的潜力通过掩膜-属性对齐

BriefGPT - AI 论文速递 ·

本文探讨了多种基于深度学习和图卷积网络的方法，用于自闭症谱系障碍（ASD）的脑活动模式预测和早期检测。研究提出的模型如Com-BrainTF和HyperGALE显著提高了预测的准确性和可解释性，展示了新方法在ASD诊断中的潜力，并强调了图形技术在神经发育研究中的应用。

基于掩膜连接的动态图学习网络用于自闭症谱系障碍

BriefGPT - AI 论文速递 ·

本文介绍了多种基于文本的自然语言人物检索方法，采用注意力机制、双编码器和跨模态匹配等技术，显著提升了检索精度。这些方法在多个数据集上表现优异，推动了监控视频检索领域的发展。

AMNS：基于注意力加权的选择性掩膜和噪声标签抑制用于文本到图像的人物检索

BriefGPT - AI 论文速递 ·

本文介绍了多种新型多模态情感分析模型，如Tensor Fusion Network和基于Transformer的自适应语言引导模型（ALMT）。这些模型通过融合语音、手势等信息，显著提高了情感识别的准确性和效率，且在多个数据集上表现出色，有效解决了模态间信息冲突和稀疏对齐的问题。

GSIFN：一种基于图结构和交错掩膜的多模态变换融合网络用于多模态情感分析

BriefGPT - AI 论文速递 ·

本文介绍了一种基于条件CycleGAN的虚拟IHC染色方法，显著提升了图像转换效果，并探讨了深度学习在肿瘤检测和病理图像生成中的应用，提出的新模型和学习策略提高了免疫组化染色图像的生成质量和准确性。

基于掩膜引导的对抗转移学习进行组织学虚拟染色以检测三级淋巴结构

BriefGPT - AI 论文速递 ·

本文提出了一种双流框架方法，结合多类关注区域模块（MCAR）和注视模型，以提高多类别目标识别和语义分割的准确性。该方法在多个数据集上表现优异，展示了深度学习在图像处理中的应用潜力。

多标签下的下水道管道缺陷识别：基于掩膜注意力特征增强和标签相关性学习

BriefGPT - AI 论文速递 ·

本文介绍了多种高清地图构建方法，包括 MGMap、VectorMapNet 和 MachMap。MGMap 通过学习面具实现精确定位，VectorMapNet 提高了地图学习性能，MachMap 达到最高精度。此外，提出了 M2BEV 框架，结合多摄像头图像进行三维物体检测和地图分割，优化了在线高清地图构建的准确性和效率。

Mask2Map: 基于鸟瞰分割掩膜的矢量高精度地图构建

BriefGPT - AI 论文速递 ·

利用视觉 - 语言模型的文本嵌入方法进行域广义语义分割 (Domain Generalized Semantic Segmentation)，通过文本对象查询用于像素分组，并引入 textual query-driven mask transformer (tqdm) 框架来提高模型对感兴趣类别的语义理解能力和对极端领域的泛化能力。

文本查询驱动的掩膜变换器用于领域广义分割

BriefGPT - AI 论文速递 ·

本文介绍了一种创新的遥感图像变化检测网络C-3PO，该网络结合了辅助变化检测分支和语义融合模块，利用深度学习和弱监督学习技术，显著提高了变化检测的准确性和效率。

MaskCD：基于掩膜分类的遥感变化检测网络

BriefGPT - AI 论文速递 ·

本文介绍了HiViT，一种高效且性能良好的分层视觉转换器。实验证明，HiViT-B在ImageNet-1K上相对于ViT-B的准确率提高了0.6％，比Swin-B快了1.9倍，并在检测和分割等下游任务中提高了泛化性能。

LUM-ViT：适用于带宽有限的光信号采集的可学习欠采样掩膜视觉变换器

BriefGPT - AI 论文速递 ·

本研究提出了一种新算法，用于场景文本检测，通过一组策略提高了文本定位质量，与EAST集成，实现了快速运行和有竞争力的性能。

基于类别感知的文本场景识别的掩膜引导特征细化

BriefGPT - AI 论文速递 ·

通过自监督预训练的方法，使用I2P-MAE从2D预训练模型中获得优秀的3D表示。引入了两种图像到点的学习方案，通过2D引导遮罩策略和多视角2D特征重构可见的点。在ModelNet40上，冻结的I2P-MAE达到了93.4％的线性SVM准确性。在ScanObjectNN上微调后，达到了90.11％的最新技术水平，比第二好的方法高3.68％，展示出优秀的可转移能力。

通过点特征增强掩膜自编码器实现紧凑 3D 表示

BriefGPT - AI 论文速递 ·

基于 Hamiltonian 变分自编码器（HVAE），提出了一种解决医学图像分割中训练数据不足挑战的端到端架构，通过改进传统变分自编码器（VAE）的后验分布近似，提高图像生成质量，在数据稀缺条件下优于生成对抗架构，实现了图像质量的优化和准确的肿瘤掩膜合成。在 MICCAI 的 Brain Tumor Segmentation Challenge（BRATS）和 Head and Neck...

医学图像及相应分割掩膜的端到端自编码架构

BriefGPT - AI 论文速递 ·

该文介绍了一种紧凑、经济高效的快照光谱成像系统ADIS，它由一个具有超薄正交光阑的成像镜头和一个拼贴式滤波器传感器组成。通过正交光罩产生的基于衍射的空间 - 光谱投影工程，实现了亚超像素空间分辨率和高光谱分辨率成像。

MLP-AMDC：一种用于自适应掩膜双摄像头快照高光谱成像的 MLP 架构

BriefGPT - AI 论文速递 ·

该研究提出了一种名为MaCo的多模态医学基础模型，通过遮蔽对比学习实现医学影像任务的细粒度对齐和零样本学习，并结合相关权重机制来增强表示学习能力。在六个开源X射线数据集上评估MaCo，实验结果表明其在分类、分割和零样本阶段定位方面优于七种最先进的方法，展示了其在促进各种医学图像分析任务方面的巨大潜力。

基于掩膜对比学习的细粒度对齐算法：提升放射学报告基础模型的表示能力

BriefGPT - AI 论文速递 ·

本文介绍了一种用于无监督目标检测和实例分割的方法，通过自监督特征生成掩膜并优化预测结果，实验证明在Zero-shot任务中达到了SOTA效果。

CutLER：一种用于无监督目标检测和实例分割的方法

华为云官方博客 ·