小红花·文摘

本研究提出了一种“视频深度任意物体”模型，解决了单目深度估计在视频中的时间不一致性问题。该模型在超长视频中实现了高质量的一致性深度估计，且效率未受影响，实验结果在多个基准上创下新纪录。