Meta发布的SAM 3版本显著提升了分割模型的稳定性和准确性,优化了小物体和复杂环境的掩膜一致性,支持更快的推理速度,适用于AR/VR、科学成像和机器人感知等多种应用场景。该模型已开源,便于部署和集成。
本研究提出了一种结合视觉语言推理与无监督领域适应的方法,解决了现有分割模型在训练时的类别限制。通过多尺度数据和增强文本嵌入,构建了首个无需共享类别的UDA-FROVSS框架,有效提升了细粒度分割能力。
本研究提出一种新方法,通过结合预训练分割模型、任务感知重建损失和对抗学习,解决基础强化学习中的干扰问题,提高学习效率和鲁棒性。
本研究提出了一种新颖的生成增强方法,旨在解决开放世界场景中分割模型在识别领域和语义分布转移方面的挑战,从而提升OOD检测和领域泛化性能。
本研究提出了一种新的对抗攻击策略——区域引导攻击(RGA),旨在利用区域引导图对任意分割模型(SAM)进行扰动,从而提高攻击成功率,揭示其潜在弱点。
深度生成模型在图像生成中常有感知性瑕疵。研究提出感知性瑕疵定位(PAL)方法,创建了10,168个图像的数据集,标注像素级瑕疵。训练的分割模型能有效定位瑕疵,并在少量样本下适应新模型。还提出放大补全流程用于修复瑕疵,适用于自动修复、质量评估和异常检测。数据集和代码已发布。
在自动驾驶中,精确分割LiDAR数据很重要。MMDetection3D-lidarseg是一个工具箱,用于高效训练和评估LiDAR分割模型,支持多种模型和数据增强技术,提升计算效率和性能。它简化了开发和评估流程,实验验证了其有效性,代码和模型已公开。
本文介绍了一种新型流水线,用于更接近临床应用的超声平面姿态估计,以实现对胎儿大脑中标准平面的更有效导航。通过半监督分割模型和分类机制,实现对多样化的胎儿大脑图像的可靠分割和精确定位。该模型能过滤掉缺少大脑的帧,并为包含大脑的帧生成掩模,增强了平面姿态回归在临床环境中的相关性。该方法在指导超声波医生至标准平面方面具有优势。验证结果证明了该方法的实用可行性和潜力。
该研究使用3D Residual UNet模型和广义Dice焦点损失函数,成功解决了PET/CT扫描中自动分割癌性病灶的挑战。经过5折交叉验证,平均Dice相似系数为0.6687,为常规PET/CT图像分析提供了有效的分割模型。
本文介绍了一种新型流水线,旨在将超声平面姿态估计更接近临床应用,以实现对胎儿大脑中标准平面的更有效导航。通过半监督分割模型和分类机制,实现对多样化的胎儿大脑图像的可靠分割和精确定位。该模型能过滤掉缺少大脑的帧,并为包含大脑的帧生成掩模,增强了平面姿态回归在临床环境中的相关性。通过验证,证明了该方法在补充现有胎儿超声技术和推进产前诊断实践方面的潜力。
本研究提出了一种新框架,通过生物物理建模生成逼真的细胞形状和对齐,改善分割模型的训练效果。量化评估显示,该方法生成的合成训练数据优于手动标注和预训练模型,展现了生物物理建模在提高合成训练数据质量方面的潜力。
本研究提出了SAM-REF框架,解决了现有分割模型处理提示信息与图像结合时的低效和信息提取不足的问题。实验证明该方法在复杂场景中表现出卓越的有效性和高效性,超越了当前的先进模型。
本研究提出了SAM-REF框架,解决了现有分割模型在处理提示信息与图像结合时的低效和信息提取不足的问题。实验证明该方法在复杂场景中表现出卓越的有效性和高效性,超越了当前的先进模型。
本文介绍了一种新型流水线,用于更接近临床应用的超声平面姿态估计,以实现对胎儿大脑中标准平面的更有效导航。通过半监督分割模型和分类机制,实现对多样化的胎儿大脑图像的可靠分割和精确定位。该模型能过滤掉缺少大脑的帧,并为包含大脑的帧生成掩模,增强了平面姿态回归在临床环境中的相关性。该方法在指导超声波医生至标准平面方面具有优势。验证结果证明了该方法的实用可行性。
该研究提出了Open-NeRF,通过利用大规模的分割模型和层次嵌入,实现了从开放词汇中将神经辐射场分解为对象的挑战。实验结果表明,Open-NeRF在开放词汇的场景中胜过了其他方法。Open-NeRF为NeRF分解提供了一个有前途的解决方案,能够在开放世界的三维场景中实现新的机器人和视觉语言交互应用。
提出了MS-Twins(Multi-Scale Twins)分割模型,通过结合不同尺度和级联特征,能更好地捕捉语义和细粒度信息,解决了医学图像分割中的最优化问题。在Synapse和ACDC两个数据集上,MS-Twins相较于现有网络结构有了显著进展,在Synapse数据集上的性能比SwinUNet高出8%,与nnUNet相比,在Synapse和ACDC上MS-Twins的性能稍有优势。
提出了MS-Twins(Multi-Scale Twins)分割模型,通过结合不同尺度和级联特征,解决了医学图像分割中的最优化问题。在Synapse和ACDC数据集上,MS-Twins相较于现有网络结构有显著进展,性能比SwinUNet高出8%,与nnUNet相比,在Synapse和ACDC上MS-Twins性能稍有优势。
我们提出了一个分割模型 (DRU-Net),用于人类非小细胞肺癌的分割和分类结果的改善。该模型基于截断预训练的 DenseNet201 和 ResNet101V2,使用轻量级 U-Net 作为修正模型。我们使用了两个数据集来创建模型,平均 Dice 相似性系数为 0.91。空间增强方法提高了网络性能 3%。定性分析显示,DRU-Net 模型在肿瘤检测方面通常是成功的,但在伴有炎症和反应性变化的肿瘤中可能出现假阳性和假阴性分割区域。
该研究提出了一种新的图像到图像风格转换方法,利用单个深度卷积神经网络进行对象风格转换。该方法结合了 YOLOv8 分割模型和骨干神经网络,通过平滑地转换艺术风格来增强图像中的对象的视觉吸引力。该方法简化了模型的训练和应用,展示了在两个内容图像上的效果,并展示了在同一图像上应用风格转换于多个对象的能力。
完成下面两步后,将自动完成登录并继续当前操作。