计算机视觉中的分割不仅是将图像切割成片段,更是为每个像素赋予意义。主要有四种分割类型:图像分割、语义分割、实例分割和全景分割。这些方法在细节和理解上各有不同,广泛应用于自动驾驶、医学成像和增强现实等领域。
本研究针对rip流实例分割,提供了包含2466张图像和17段无人机视频的数据集。训练的YOLOv8-nano模型在验证集上mAP50达到88.94%,为未来研究提供了基准,并公开了代码和数据集。
本研究提出了一种实例温度分配(ITA)方法,旨在解决实例分割中的广义类发现(GCD)任务。该方法利用有无标签数据来发现新类,实验结果表明其在多个数据集上优于现有技术。
本文提出了一种名为Contourformer的实时实例分割算法,通过可变形注意力模块和多阶段优化,提高了分割精度和推理速度,为基于轮廓的实例分割提供了新方案。
本研究提出D-PLS方法,解决4D全景激光雷达分割中语义分割与实例分割的耦合问题。利用单次扫描的语义分割作为先验信息,显著提升了分类和关联任务的性能。
本研究提出了MaskTerial模型,旨在自动检测和分类光学显微镜图像中的二维材料薄片。该深度学习模型采用实例分割网络,经过合成数据预训练,能够快速适应新材料,尤其在低对比度材料(如氮化硼)检测中表现优于现有技术。
本研究提出了一种通过单一标记点进行熵估计的方法,解决了显微镜结构分割中对手动绘制轮廓的需求。尽管像素标签减少了95%,该方法在实例分割性能上依然表现良好,具有应用潜力。
本文介绍了多种创新的3D模型学习方法,如Bridge3D、OpenMask3D和Mx2M。这些方法利用预训练模型和跨模态知识,提升了3D实例分割和语义分割的性能,尤其在开放词汇任务中表现优异,展示了无需监督的有效性和快速部署的潜力。
DIS-Mine是一种新颖的实例分割方法,旨在在地下矿山低光照条件下识别灾害影响区域,以提升救援效率。该方法通过改进图像亮度和结合特征匹配技术,实验结果显示F1得分高达86.0%。
本研究提出了一种基于大型语言模型的自动注释和实例分割方法,旨在解决深度学习中的数据收集和手动注释瓶颈。该方法在果实实例分割任务中取得了0.9513的Dice系数和0.9303的IoU,验证了其有效性。
本研究提出了一种基于变换器的统一框架,解决增量少样本目标检测和实例分割问题。通过扩展Mask-DINO,该方法有效降低新类别的过拟合和基础类别的遗忘,实验结果在COCO和LVIS数据集上表现优异。
本研究提出了一种基于点云的实例分割方法,结合3D稀疏卷积神经网络和注意力匹配网络,有效解决果实监测中的尺寸、形状和遮挡问题。实验结果表明,该方法在复杂场景下具有更高的监测精度。
本研究通过实例分割模型提升了复杂手术中瞄准光束的检测准确性,手术视频中的检测率达到85%,增强了实时图像引导的可靠性。
该研究提出了一种多阶段方法,通过独立加权损失函数和附加解码器头,实现了数字组织学中核的实例分割和分类,显著提升了19种组织类型的性能。
飞桨发布的Mask-RT-DETR模型在实例分割任务中表现优异,支持134个模型。该模型基于RT-DETR优化,采用PP-HGNetV2作为骨干网络,提升了精度和速度。通过IoU-aware Query Selection和MaskDINOHead技术,Mask-RT-DETR在相同推理耗时下达到了SOTA级别的精度,适用于多个领域。
PixLab Annotate 是一款高效的网页图像标注工具,适用于机器学习模型训练。它提供用户友好的界面和多种高级标注工具,支持实例分割和灵活的输出格式。用户无需安装即可在浏览器中使用,适合开发者、数据科学家和学生。
本研究提出了一种新型神经网络架构,用于3D点云场景的实例分割。通过并行学习系数和原型,省略传统聚类步骤,提高了处理速度和稳定性。实验结果显示,该方法比现有技术快28%,推理时间的标准差显著降低。
本研究提出了一种新方法,通过解耦事物与物体查询来减少激光雷达全景分割中实例分割与语义分割任务的相互竞争及分类/分割的模糊性问题。DQFormer框架整合了这两种分割任务,显著提升了分割效果,并在nuScenes和SemanticKITTI数据集上进行了验证。
本研究提出了一种新的方法,通过结合场景几何、物体中心跟踪和实例分割,解决了自我中心视频中的3D场景理解挑战。实验结果表明,该方法在跟踪和分割一致性指标上优于现有的二维方法。
该算法使用Segment Anything Model(SAM)对2D点或盒子提示进行实例分割,实现从2D掩码预测3D形状。实验结果表明,SLF自动标注器在生成边界框标注方面表现出高质量,达到近90%的IoU。此外,该自动标注器还有希望在详细形状预测方面提供潜在的替代方法。
完成下面两步后,将自动完成登录并继续当前操作。