小红花·文摘

该方法通过学习数据驱动的时空语义表示，解决语义视频目标分割问题。它捕捉连续帧中实例之间的协同作用，并剪枝嘈杂的检测，实现更长时间的上下文依赖。实验结果表明，该方法在挑战性数据集上表现出卓越性能。