GePSAn:烹饪视频中的生成式步骤预测

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本研究提出了一种基于事件引导的范式,用于从带有文本监督的指令视频中进行过程规划的任务。该模型采用遮盖和预测方法进行关系挖掘,并将事件信息编码到顺序建模过程中来支持过程规划。实验证明了该模型的有效性。

🎯

关键要点

  • 本研究提出了一种基于事件引导的范式,用于从带有文本监督的指令视频中进行过程规划。
  • 模型通过从观察到的状态中推断事件,并基于状态和预测的事件规划行动。
  • 采用遮盖和预测方法进行关系挖掘。
  • 事件信息被编码到顺序建模过程中,以支持过程规划。
  • 实验证明了模型的有效性。
➡️

继续阅读