小红花·文摘

本研究提出了一种新型视频标记器LARP，旨在克服传统视频标记方法在自回归生成模型中的局限性。LARP通过学习整体查询来收集视觉信息，提升生成模型的表现，并在UCF101视频生成基准上取得了先进的性能，显示出其潜在的应用价值。

BriefGPT - AI 论文速递 ·

本文介绍了一种新的视频动作识别框架TSN，利用时间段网络学习ConvNet模型，在HMDB51和UCF101数据集上表现优异。还提出了记忆增强网络和时空建模机制等改进方法，进一步提升了动作识别的效果和准确性。

BriefGPT - AI 论文速递 ·

本文介绍了Fine-grained Motion Alignment（FIMA）框架，通过对比学习生成像素级的运动监督，消除时间和空间上的弱对齐，并提高运动特征的时间多样性。FIMA在UCF101、HMDB51和Diving48数据集上取得了最先进或竞争性的结果。

BriefGPT - AI 论文速递 ·

本文介绍了一种名为S3Aug的视频数据增强方法，用于动作识别。该方法通过分割和标签转换，生成多样的视频，并通过移动中间特征来增强生成视频帧之间的时间连贯性。实验证明该方法在UCF101、HMDB51和Mimetics数据集上有效，尤其对于Mimetics数据集中的非上下文视频。

BriefGPT - AI 论文速递 ·