解构视觉变换器:用于图像分类的补丁级可解释性
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了一种名为Hindered Transformer (HiT)的新架构,旨在解决视觉变换器在图像分类中的可解释性问题。该方法通过重新设计变换器,将补丁影响解析为补丁级别信息的线性组合,展现出良好的可解释性与性能平衡。
🎯
关键要点
- 本研究提出了一种名为Hindered Transformer (HiT)的新架构。
- HiT旨在解决视觉变换器在图像分类中的可解释性问题。
- 该方法通过重新设计变换器,改善分类阶段对补丁影响的解析。
- HiT能够将补丁影响解释为补丁级别信息的线性组合。
- 研究表明,HiT在可解释性和性能之间实现了良好的平衡,适合需要可解释性的应用。
➡️