本研究提出了RipVIS,一个大规模视频实例分割基准,解决了潮流识别中的数据不足问题,显著提升了分割性能,促进了海滩安全环境的建设。
本研究提出了一种新方法,结合自监督学习与视频实例分割,解决历史地图中地理实体对齐问题,显著提升模型性能,减少手动标注需求。实验结果表明,精度和F1分数有显著提高。
该文介绍了一个大规模的被遮挡的视频实例分割数据集,并提出了一个简单的插件模块,用于补充遮挡引起的缺失对象线索,取得了显着的AP提升。现有的视频理解系统无法理解这些被遮挡的实例。
本研究提出了面向近在线视频实例分割的新方法NOVIS,证明了其优越性,并在基准测试中取得了最先进的结果。研究表明,对于具有挑战性和长视频序列的情况,传统的离线方法不一定优于逐帧的在线处理。
该文介绍了视频实例分割方法DVIS,通过引入去噪策略实现在复杂和长视频中更稳定准确的目标跟踪。同时,利用DINO v2预训练的冻结的VIT-L模型探索了视觉基础模型在视频实例分割中的作用。在第5届LSVOS挑战赛中获得了第一名,开发和测试阶段分别达到了57.9 AP和56.0 AP。
完成下面两步后,将自动完成登录并继续当前操作。