双边网络与残差 U 块和双向引导注意力的实时语义分割

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种双重注意力块的方法,可提高图像/视频识别性能,在ImageNet-1k数据集和动作识别任务中取得最先进的成果。

🎯

关键要点

  • 提出了一种双重注意力块的方法。
  • 该方法聚合和传播了输入图像/视频的全局特征。
  • 提高了下一层卷积层对特征的访问效率。
  • 在ImageNet-1k数据集上,ResNet-50与双重注意力块的表现优于ResNet-152。
  • 在动作识别任务中,该模型在Kinetics和UCF-101数据集上取得了最先进的成果。
➡️

继续阅读