解构视觉变换器:用于图像分类的补丁级可解释性

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种名为Hindered Transformer (HiT)的新架构,旨在解决视觉变换器在图像分类中的可解释性问题。该方法通过重新设计变换器,将补丁影响解析为补丁级别信息的线性组合,展现出良好的可解释性与性能平衡。

🎯

关键要点

  • 本研究提出了一种名为Hindered Transformer (HiT)的新架构。
  • HiT旨在解决视觉变换器在图像分类中的可解释性问题。
  • 该方法通过重新设计变换器,改善分类阶段对补丁影响的解析。
  • HiT能够将补丁影响解释为补丁级别信息的线性组合。
  • 研究表明,HiT在可解释性和性能之间实现了良好的平衡,适合需要可解释性的应用。
➡️

继续阅读