本研究探讨了通用深度神经网络模型在自然视频中预测遮挡区域的物理理解。模型通过联合学习抽象表示,有效理解物体的持久性和形状一致性,经过一周训练后表现超越偶然,挑战传统观念。
该研究提出了一种名为YOIO的框架,通过利用帧对提供的时空信息,设计回路判断算法来获得正确的全局参考信息,并从中挖掘多种必要的全局信息。该方法可以显著提升遮挡区域的光流估计性能,而对非遮挡区域的性能没有损害。与GMA相比,该方法在遮挡区域的光流预测精度提高了10%以上,occ_out区域超过15%,计算时间缩短了27%。在436*1024像素分辨率下,该方法以每秒18.9帧的速度运行,在Sintel数据集中获得了优于所有已发表和未发表的能够实时运行的方法的最新成果。
完成下面两步后,将自动完成登录并继续当前操作。