MS-Temba:用于高效时序动作检测的多尺度时序Mamba

📝

内容提要

本文解决了在长时间未剪辑视频中,由于密集分布的动作而导致的时序动作检测难题。研究中创新性地采用了Mamba架构,并提出了多尺度时序Mamba(MS-Temba),通过引入局部和全局特征的多尺度建模,显著减少参数数量,同时在长视频上超越现有的最先进方法,展现出更高的效率和性能。

🏷️

标签

➡️

继续阅读