该方法通过学习数据驱动的时空语义表示,解决语义视频目标分割问题。它捕捉连续帧中实例之间的协同作用,并剪枝嘈杂的检测,实现更长时间的上下文依赖。实验结果表明,该方法在挑战性数据集上表现出卓越性能。
完成下面两步后,将自动完成登录并继续当前操作。