BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

通过调控交叉注意力记忆实现高效视频对象分割

提出了一种名为 MAVOS 的基于变压器的方法,通过引入优化和动态的长期调制交叉注意力 (MCA) 存储器,对长视频进行模型化学处理,同时在不需要频繁扩展内存的情况下实现跨帧的时间平滑。在多个基准测试中,包括 LVOS、Long-Time Video 和 DAVIS 2017,大量实验证明了我们提出的改进的有效性,实现了实时推理,并在长视频上显著降低了内存需求,而不降低分割精度。与现有的最佳基于变压器的方法相比,我们的 MAVOS 在可比较的短视频和长视频数据集上将速度提高了 7.6 倍,同时将 GPU 内存降低了 87%。值得注意的是,在 LVOS 数据集上,我们的 MAVOS 在单个 V100 GPU 上以每秒 37 帧的速度实现了 63.3% 的 J&F 分数。

研究人员提出了一种名为MAVOS的基于变压器的方法,通过引入优化和动态的长期调制交叉注意力存储器,对长视频进行模型化学处理。实验证明该方法在多个基准测试中具有高效性能,并在长视频上降低了内存需求。与现有方法相比,MAVOS在速度和内存方面都有显著提升。

MAVOS 内存需求 变压器 模型化学处理 长视频

相关推荐 去reddit讨论

热榜 Top10

Dify.AI
Dify.AI
LigaAI
LigaAI
eolink
eolink
观测云
观测云

推荐或自荐