本研究提出了一种“视频深度任意物体”模型,解决了单目深度估计在视频中的时间不一致性问题。该模型在超长视频中实现了高质量的一致性深度估计,且效率未受影响,实验结果在多个基准上创下新纪录。
完成下面两步后,将自动完成登录并继续当前操作。