超越训练:用于零-shot视频理解的动态令牌合并

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了动态令牌合并框架DYTO,旨在提升零-shot视频任务的保真度和令牌效率。实验结果表明,DYTO优于传统方法,设立了新标准。

🎯

关键要点

  • 本研究提出了动态令牌合并框架DYTO。
  • DYTO旨在提升零-shot视频任务的保真度和令牌效率。
  • 实验结果表明,DYTO优于传统的微调及无训练方法。
  • DYTO为零-shot视频理解设定了新的最先进水平。
➡️

继续阅读