本文介绍了一种名为Temporal Squeeze(TS)池化的视频表示学习方法,通过转化视频帧为少量图像来提取移动信息。作者设计了Temporal Squeeze Network(TeSNet)视频分类模型,并在两个基准测试上与最先进的方法进行了比较。
完成下面两步后,将自动完成登录并继续当前操作。