从一段长的无标签视频中学习强大的图像编码器,ImageNet 是否值得?
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该文介绍了一种新的学习方法MIL-NCE,用于从讲述视频中学习视频表示,无需手动注释。该方法在多个数据集上进行了评估,证明其优于已发表的自监督方法和多个全监督基准线的表现。
🎯
关键要点
- 介绍了一种新的学习方法MIL-NCE
- MIL-NCE用于从讲述视频中学习视频表示
- 该方法无需手动注释
- 通过对齐不对称的讲述视频学习视频表示
- 在HMDB-51、UCF-101、Kinetics-700等多个数据集上进行了评估
- 证明MIL-NCE优于已发表的自监督方法和多个全监督基准线的表现
➡️