ActFusion:动作分割与预测的统一扩散模型

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本研究提出了ActFusion统一扩散模型,旨在解决视频中动作的时间分割和长期预测问题,最终在标准基准上取得了优异表现。

🎯

关键要点

  • 本研究提出了ActFusion统一扩散模型。
  • 该模型旨在解决视频中动作的时间分割和长期预测问题。
  • 之前这两个任务被分开研究。
  • ActFusion通过新的预测掩蔽策略处理可见和不可见的序列部分。
  • 模型实现了在这两个任务间的双向互惠。
  • 最终在标准基准上取得了最佳性能,超越了专门针对单一任务的模型。
➡️

继续阅读