该研究提出了一种新的混合网络TGBFormer,用于视频目标检测,解决了全球和局部信息利用不足的问题。引入空间-时间变换模块后,实验结果表明该方法在ImageNet VID数据集上表现优异,具有实际应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。