本研究提出了一种双流膨胀3D卷积网络的弱监督学习框架,旨在提升城市监控系统中的异常检测技术,增强准确性并减少人工标注需求。
I3D是一种视频理解模型,采用双流网络架构,将2D网络扩展为3D网络。文章介绍了Kinetics数据集,包含400种人体动作,每种动作有400多个来自YouTube的视频示例。模型整体架构基于Inception-v1,后期改用ResNet以提升性能。
完成下面两步后,将自动完成登录并继续当前操作。