视频的学习自回归生成先验的标记化
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的视频标记器LARP,克服了传统自回归生成模型的局限性。LARP通过整体查询学习视觉信息,显著提升了生成模型的性能,在UCF101基准测试中表现优异,展现了其潜在应用价值。
🎯
关键要点
- 本研究提出了一种新的视频标记器LARP,克服了传统自回归生成模型的局限性。
- LARP通过整体查询学习视觉信息,显著提升了生成模型的性能。
- 在UCF101基准测试中,LARP表现优异,达到了最先进的性能。
- LARP展现了其在视频自回归生成中的潜在应用价值。
➡️