DiffAnt:行动预测的扩散模型
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种新的动作预测方法,使用多阶段LSTM网络和上下文感知和动作感知特征,引入新的损失函数。该方法在视频序列仅有少量片段的情况下,能够实现高准确度的预测,并在多个公开数据集上超过了先前最优的动作预测方法,准确率相对提升了22.0%(JHMDB-21),14.0%(UT-Interaction),和49.9%(UCF-101)。
🎯
关键要点
-
提出了一种新的动作预测方法
-
基于多阶段LSTM网络
-
运用上下文感知和动作感知特征
-
引入了一种新的损失函数
-
在视频序列仅有少量片段的情况下实现高准确度的预测
-
在多个公开数据集上超过了先前最优的动作预测方法
-
准确率相对提升了22.0%(JHMDB-21)
-
准确率相对提升了14.0%(UT-Interaction)
-
准确率相对提升了49.9%(UCF-101)
➡️