LKFormer:红外图像超分辨率的大内核 Transformer

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

InstaFormer是一种基于Transformer的网络结构,用于实例感知的图像到图像的转换。它整合全局和实例级信息,通过自注意力模块考虑上下文信息。使用自适应实例归一化代替层规范化,并引入实例级内容对比损失提高实例感知能力和翻译质量。实验证明,InstaFormer具有更好的性能。

🎯

关键要点

  • 提出了一种新型的基于 Transformer 的网络结构 InstaFormer,用于实例感知的图像到图像的转换。
  • InstaFormer 能够有效整合全局和实例级信息,通过自注意力模块考虑上下文信息。
  • 框架通过边界框信息提取实例级特征,学习对象实例与全局图像之间的互动。
  • 使用自适应实例归一化(AdaIN)代替层规范化(LayerNorm),支持多模式翻译。
  • 引入实例级内容对比损失,提高实例感知能力和翻译质量。
  • 实验表明,InstaFormer 的性能优于最新方法。
➡️

继续阅读