小红花·文摘

本文介绍了一种名为Temporal Squeeze（TS）池化的视频表示学习方法，通过转化视频帧为少量图像来提取移动信息。作者设计了Temporal Squeeze Network（TeSNet）视频分类模型，并在两个基准测试上与最先进的方法进行了比较。