通过图像扩散过程进行动作检测
原文中文,约400字,阅读约需1分钟。发表于: 。通过 ADIDiff 框架的三图像生成过程,本研究旨在通过图像生成开始点、结束点和动作类别预测的图像来解决动作检测问题,并通过离散的行列转换器设计来处理特殊属性的图像,从而在两个广泛使用的数据集上取得了最先进的结果。
本文介绍了一种新颖的扩散模型ActionDiffusion,用于指导教学视频中的过程规划。该模型考虑了动作之间的时间依赖关系,并利用了动作按特定顺序执行的信息。实验结果表明,该方法在准确性以外的指标上胜过了以前的最先进方法,提高了过程规划的性能。