本研究提出了RipVIS,一个大规模视频实例分割基准,解决了潮流识别中的数据不足问题,显著提升了分割性能,促进了海滩安全环境的建设。
本研究提出了一种新方法,通过自监督学习和视频实例分割提高历史地图中地理实体的对齐效率,减少手动标注需求。实验结果表明,该方法在精度和F1分数上显著提升。
本文介绍了一系列基于学习的运动信号分割方法,利用光流和事件相机技术实现独立运动目标的分割和运动参数估计。研究表明,新的视频实例分割方法通过融合多种线索,能够在复杂场景中实时跟踪实例,准确度高达90%。此外,提出的半监督框架在降低计算复杂度的同时,性能与完全监督方法相当,展示了在多目标跟踪中的有效性。
本文介绍了一种基于图分割的物体分割方法,利用3D滤波技术实现快速像素聚类。该方法在未监督和半监督的DAVIS-2016数据集上表现优异,并在SegTrackv2数据集上取得最佳结果。研究还提出了多种新的视频实例分割框架,利用时空一致性和对比学习策略显著提升了分割性能,特别是在OVIS数据集上表现突出。
本文介绍了多种基于CLIP模型的开放词汇语义分割方法,如VT-CLIP、CLIP-VIS和NACLIP。这些方法通过引入新模块和技术,显著提升了视频实例分割和语义分割的性能,尤其在零样本任务中表现突出,有效解决了领域偏差和特征对齐问题。
该研究提出了一种新的推理分割任务,展示了多模态语言模型LISA在复杂推理分割中的有效性。研究还介绍了开放词汇视频实例分割任务及其数据集,提出了VLP-RVOS框架以解决视频对象分割中的转移挑战,并开发了LLM-Seg框架,连接基础分割模型与大型语言模型,生成高质量的推理分割数据集LLM-Seg40K。
本研究提出了多种基于CLIP的新方法,涵盖视频实例分割、零样本分类和OOD检测等任务。其中,CLIP-VIS在视频分割中表现优异,AutoCLIP提高了分类准确性,CLIPN实现了零样本OOD检测,GC-CLIP增强了分类效果,CLIP-Count实现了高精度物体计数。这些方法在多个数据集上取得了显著进展。
本文介绍了多种视频实例分割的新方法,如MaskFreeVIS、OpenVIS和VMT。这些方法通过减少人工注释需求,利用高效特征提取和自动注释技术,提升了视频中对象的分割和跟踪性能,并在多个基准测试中展示了其有效性和竞争力。
该文介绍了一个大规模的被遮挡的视频实例分割数据集,并提出了一个简单的插件模块,用于补充遮挡引起的缺失对象线索,取得了显着的AP提升。现有的视频理解系统无法理解这些被遮挡的实例。
本研究提出了面向近在线视频实例分割的新方法NOVIS,证明了其优越性,并在基准测试中取得了最先进的结果。研究表明,对于具有挑战性和长视频序列的情况,传统的离线方法不一定优于逐帧的在线处理。
该文介绍了视频实例分割方法DVIS,通过引入去噪策略实现在复杂和长视频中更稳定准确的目标跟踪。同时,利用DINO v2预训练的冻结的VIT-L模型探索了视觉基础模型在视频实例分割中的作用。在第5届LSVOS挑战赛中获得了第一名,开发和测试阶段分别达到了57.9 AP和56.0 AP。
完成下面两步后,将自动完成登录并继续当前操作。