eMotions:一份用于短视频情绪识别的大规模数据集
原文中文,约400字,阅读约需1分钟。发表于: 。现今,短视频对于信息获取和分享至关重要。鉴于短视频情感数据的缺乏,我们介绍了一个大规模的数据集,名为 eMotions,包含 27996 个视频。我们通过优化人员分配和多阶段注释来减轻主观因素对标签质量的影响。另外,我们通过有针对性的数据采样提供了类别平衡和面向测试的变体。我们提出了一种端到端的基线方法 AV-CPNet,采用视频 Transformer...
研究人员介绍了一个名为eMotions的大规模数据集,包含27996个视频。他们提出了一种基于视频Transformer的端到端方法AV-CPNet,用于学习语义相关表示。通过实验证明了该方法的有效性。数据集和代码已开放。