DiffAnt:行动预测的扩散模型

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种新的动作预测方法,使用多阶段LSTM网络和上下文感知和动作感知特征,引入新的损失函数。该方法在视频序列仅有少量片段的情况下,能够实现高准确度的预测,并在多个公开数据集上超过了先前最优的动作预测方法,准确率相对提升了22.0%(JHMDB-21),14.0%(UT-Interaction),和49.9%(UCF-101)。

🎯

关键要点

  • 提出了一种新的动作预测方法

  • 基于多阶段LSTM网络

  • 运用上下文感知和动作感知特征

  • 引入了一种新的损失函数

  • 在视频序列仅有少量片段的情况下实现高准确度的预测

  • 在多个公开数据集上超过了先前最优的动作预测方法

  • 准确率相对提升了22.0%(JHMDB-21)

  • 准确率相对提升了14.0%(UT-Interaction)

  • 准确率相对提升了49.9%(UCF-101)

➡️

继续阅读