PoseMamba:基于双向全局 - 局部时空状态空间模型的单目 3D 人体姿态估计
原文中文,约300字,阅读约需1分钟。发表于: 。基于 Mamba 结构的 PoseMamba 方法以线性复杂度实现了对单目视频中的三维人体姿势估计,通过双向的全局局部时空 SSM 块对人体关节关系和时间相关性进行了全面建模,并通过重新排序策略增强了局部建模能力,取得了最先进的性能表现。
VideoMamba是一种新型的纯Mamba架构,专为视频识别设计。它利用线性复杂度和选择性SSM机制,实现更高效的处理。VideoMamba能够捕捉非连续空间和连续时间信息之间的复杂关系,展现出竞争力和卓越的效率。它是视频理解的强大工具,为未来视频分析研究提供了一个简单而有效的基准。