通过图像扩散过程进行动作检测
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新颖的扩散模型ActionDiffusion,用于指导教学视频中的过程规划。该模型考虑了动作之间的时间依赖关系,并利用了动作按特定顺序执行的信息。实验结果表明,该方法在准确性以外的指标上胜过了以前的最先进方法,提高了过程规划的性能。
🎯
关键要点
- 提出了一种新颖的扩散模型ActionDiffusion,用于指导教学视频中的过程规划。
- 该模型是第一个在扩散模型中考虑动作之间的时间依赖关系。
- 利用动作按特定顺序执行的丰富信息内容。
- 通过将动作信息投影到噪声空间实现对动作的学习和去噪。
- 在噪声添加阶段,通过在噪声掩码中添加动作嵌入来学习不同动作步骤之间的相关性。
- 在三个教学视频基准数据集上进行了广泛的实验,结果表明该方法在多个指标上超越了以前的最先进方法。
- 研究结果表明,添加动作嵌入能够更好地学习动作的时间依赖关系,提高过程规划的性能。
🏷️
标签
➡️