小红花·文摘

本研究提出了一种新型视频标记器LARP，旨在克服传统视频标记方法在自回归生成模型中的局限性。LARP通过学习整体查询来收集视觉信息，提升生成模型的表现，并在UCF101视频生成基准上取得了先进的性能，显示出其潜在的应用价值。