本研究提出了一种新方法,通过动作查询定位视频中的重复动作周期,解决计数不一致性问题。采用多尺度时间关联的transformer编码和基于密度图的预测方法,显著提高了计数准确性,并在多个数据集上优于现有技术。此外,引入不规则视频动作计数(IVAC)和时间自相似性方法,进一步提升了视频动作计数的性能和鲁棒性。
本研究提出了一种新方法,通过动作查询表示和时间自相似性量化视频中的重复动作周期。该方法在多个基准测试中表现优异,解决了复杂重复动作的计数问题,并引入音频信息以提高准确性。实验结果表明,该模型在不同数据集上优于现有技术,具有良好的鲁棒性和通用性。
完成下面两步后,将自动完成登录并继续当前操作。