本研究提出MASSeg模型,解决复杂视频物体分割中的小物体识别、遮挡处理和动态场景建模问题,利用MOSE+数据集和数据增强策略显著提升模型性能。
该报告介绍了一种名为SAMTrack的视频物体分割和跟踪框架,支持多模态交互方法。SAM-Track结合了SAM关键帧分割模型和DeAOT跟踪模型,并融合了Grounding-DINO。该框架在无人机技术、自动驾驶、医学成像、增强现实和生物分析等领域中具有实用性和显着能力。
完成下面两步后,将自动完成登录并继续当前操作。