本文提出了一种使用多阶段LSTM网络和上下文感知和动作感知特征的新动作预测方法,引入新的损失函数,能够在视频序列仅有少量片段的情况下实现高准确度的预测。在多个公开数据集上,准确率相对提升了22.0%(JHMDB-21),14.0%(UT-Interaction),和49.9%(UCF-101)。
本文提出了一种新的动作预测方法,使用多阶段LSTM网络和上下文感知和动作感知特征,引入新的损失函数。该方法在视频序列仅有少量片段的情况下,能够实现高准确度的预测,并在多个公开数据集上超过了先前最优的动作预测方法,准确率相对提升了22.0%(JHMDB-21),14.0%(UT-Interaction),和49.9%(UCF-101)。
该文介绍了一种使用多阶段LSTM网络和上下文感知、动作感知特征的新动作预测方法,引入新的损失函数,能够在视频序列仅有少量片段的情况下实现高准确度的预测。在多个公开数据集上,相对提升了22.0%(JHMDB-21),14.0%(UT-Interaction),和49.9%(UCF-101)的准确率。
完成下面两步后,将自动完成登录并继续当前操作。