VTG-GPT: 使用 GPT 的免调整零样本视频时态定位

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了视频时间定位(VTG)的方法,使用GPT模型进行零训练或微调,以减少人为偏见和冗余信息,并实现与有监督方法相媲美的性能。

🎯

关键要点

  • 视频时间定位(VTG)的目标是根据语言查询定位特定时间段。
  • 提出了 VTG-GPT,这是一种基于 GPT 的零训练或微调的方法。
  • VTG-GPT 方法旨在减少人为偏见和冗余信息。
  • VTG-GPT 的性能与有监督方法相媲美。
➡️

继续阅读