本研究提出了Seg2HOI框架,结合视觉模型与人机交互任务,能够有效生成分割掩膜的四元组,其性能与先进方法相当,具有良好的应用潜力。
本研究提出了MedSegFactory框架,旨在解决医学图像和分割掩膜生成中的数据稀缺问题。该框架结合双流扩散模型和交叉注意机制,生成高质量的图像-掩膜配对,显著提高了一致性和可靠性。实验结果显示,MedSegFactory在2D和3D分割任务中表现优越,提升了医学成像的效率和准确性。
本研究解决了遥感图像变化描述领域中以往方法对特定网络架构的过度依赖和较差的泛化能力的问题。通过提出一种结合扩散模型的新方法,转变了传统特征学习范式为数据分布学习,进而提升了变化检测和描述的准确性。实验结果表明,该方法在多个遥感变化检测描述数据集上表现优越,具有良好的应用潜力。
本研究提出了一种新的视频模型MV-CC,旨在简化遥感图像变化描述中的特征提取,实验结果显示该模型性能优于其他先进方法。
本文评估了基于Segment Anything Model (SAM)的医学图像分割能力,发现其在CT数据上表现良好,但在结构性目标上存在局限。通过适当提示,SAM的性能显著提升。研究还提出了新模型和方法,展示了在肿瘤分割和病理学任务中的潜力。
本文探讨了多种基于深度学习和图卷积网络的方法,用于自闭症谱系障碍(ASD)的脑活动模式预测和早期检测。研究提出的模型如Com-BrainTF和HyperGALE显著提高了预测的准确性和可解释性,展示了新方法在ASD诊断中的潜力,并强调了图形技术在神经发育研究中的应用。
本文介绍了多种基于文本的自然语言人物检索方法,采用注意力机制、双编码器和跨模态匹配等技术,显著提升了检索精度。这些方法在多个数据集上表现优异,推动了监控视频检索领域的发展。
该研究提出了一种自适应语言引导的多模态Transformer(ALMT)模型,用于多模态情感分析。通过自适应的超模态学习模块,该模型可以从视觉和音频特征中学习抑制不相关和冲突的表示,实现有效的情感分析。实验证明该模型在多个数据集上取得了最先进的性能。
路径学语义保持学习方法(PSPStain)提出了两种新颖的学习策略:蛋白质感知为中心学习策略(PALS)和原型一致学习策略(PCLS)。PSPStain在公共数据集上评估了性能,胜过当前最先进的H&E-to-IHC虚拟染色方法,并展示了真实和虚拟染色分期之间的高度病理学相关性。
这篇文章介绍了一种基于掩膜注意力和标签相关性学习的多标签管道缺陷识别方法。该方法使用较少的训练数据集,实现了接近最新分类性能,并在全数据集上超过了当前最佳方法的11.87%。同时,该方法还能准确定位多个缺陷类别,展现出强大的模型解释性。
本研究提出了VectorMapNet,一种端到端矢量化高清地图学习管道,能够预测鸟瞰图中的稀疏折线。实验结果显示,VectorMapNet在地图学习性能上优于以前的方法。
利用视觉 - 语言模型的文本嵌入方法进行域广义语义分割 (Domain Generalized Semantic Segmentation),通过文本对象查询用于像素分组,并引入 textual query-driven mask transformer (tqdm) 框架来提高模型对感兴趣类别的语义理解能力和对极端领域的泛化能力。
本论文提出了一种基于遮罩预测和分类的变化检测方法,通过自适应生成分类掩蔽层检测变化区域。实验结果表明,该方法在五个基准数据集上优于其他最先进模型。
通过检查COCO(2017版本)中的掩膜,发现错误并开发了COCO-ReM数据集,该数据集具有更清晰、质量更好的掩膜。评估了50个目标检测器,发现在COCO-ReM上得分更高的模型预测效果更好,训练模型收敛更快,得分更高,强调了数据质量对目标检测器的重要性。建议未来的目标检测研究使用COCO-ReM数据集。
本文介绍了HiViT,一种高效且性能良好的分层视觉转换器。实验证明,HiViT-B在ImageNet-1K上相对于ViT-B的准确率提高了0.6%,比Swin-B快了1.9倍,并在检测和分割等下游任务中提高了泛化性能。
本研究提出了一种新算法,用于场景文本检测,通过一组策略提高了文本定位质量,与EAST集成,实现了快速运行和有竞争力的性能。
通过自监督预训练的方法,使用I2P-MAE从2D预训练模型中获得优秀的3D表示。引入了两种图像到点的学习方案,通过2D引导遮罩策略和多视角2D特征重构可见的点。在ModelNet40上,冻结的I2P-MAE达到了93.4%的线性SVM准确性。在ScanObjectNN上微调后,达到了90.11%的最新技术水平,比第二好的方法高3.68%,展示出优秀的可转移能力。
基于 Hamiltonian 变分自编码器(HVAE),提出了一种解决医学图像分割中训练数据不足挑战的端到端架构,通过改进传统变分自编码器(VAE)的后验分布近似,提高图像生成质量,在数据稀缺条件下优于生成对抗架构,实现了图像质量的优化和准确的肿瘤掩膜合成。在 MICCAI 的 Brain Tumor Segmentation Challenge(BRATS)和 Head and Neck...
该文介绍了一种紧凑、经济高效的快照光谱成像系统ADIS,它由一个具有超薄正交光阑的成像镜头和一个拼贴式滤波器传感器组成。通过正交光罩产生的基于衍射的空间 - 光谱投影工程,实现了亚超像素空间分辨率和高光谱分辨率成像。
该研究提出了一种名为MaCo的多模态医学基础模型,通过遮蔽对比学习实现医学影像任务的细粒度对齐和零样本学习,并结合相关权重机制来增强表示学习能力。在六个开源X射线数据集上评估MaCo,实验结果表明其在分类、分割和零样本阶段定位方面优于七种最先进的方法,展示了其在促进各种医学图像分析任务方面的巨大潜力。
完成下面两步后,将自动完成登录并继续当前操作。