动态频谱混合器用于视觉识别
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该文介绍了一种名为动态谱混合器(DSM)的自适应结构,能够高效地学习包含高低频信息的视觉输入的详细特征。实验证明,DSM 是一种功能强大且适应性强的骨干网络,适用于各种视觉识别任务。
🎯
关键要点
- 提出了一种自适应结构,名为动态谱混合器(DSM)。
- DSM 通过离散余弦变换在频域表示标记间的相互作用。
- 能够以对数线性复杂度学习长期空间依赖性。
- 通过动态频谱权重生成层实现信息频段的突出。
- 高效地学习包含高低频信息的视觉输入的详细特征。
- 全面的实验证明,DSM 是一种功能强大且适应性强的骨干网络。
- DSM 适用于各种视觉识别任务。
➡️