GePSAn:烹饪视频中的生成式步骤预测
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究提出了一种基于事件引导的范式,用于从带有文本监督的指令视频中进行过程规划的任务。该模型采用遮盖和预测方法进行关系挖掘,并将事件信息编码到顺序建模过程中来支持过程规划。实验证明了该模型的有效性。
🎯
关键要点
- 本研究提出了一种基于事件引导的范式,用于从带有文本监督的指令视频中进行过程规划。
- 模型通过从观察到的状态中推断事件,并基于状态和预测的事件规划行动。
- 采用遮盖和预测方法进行关系挖掘。
- 事件信息被编码到顺序建模过程中,以支持过程规划。
- 实验证明了模型的有效性。
➡️