本文介绍了一种新的视频表示学习方法——Temporal Squeeze(TS)池化,能够从长视频序列中提取运动信息并映射为少量图像。结合卷积神经网络,提出了Temporal Squeeze Network(TeSNet)用于视频分类。研究表明,该方法在视频分类基准测试中表现出更高的准确性和效率。
本文介绍了一种名为Temporal Squeeze(TS)池化的视频表示学习方法,通过转化视频帧为少量图像来提取移动信息。作者设计了Temporal Squeeze Network(TeSNet)视频分类模型,并在两个基准测试上与最先进的方法进行了比较。
完成下面两步后,将自动完成登录并继续当前操作。