小红花·文摘

本文介绍了一种基于自注意力块的局部信息增强模块LIFE，通过提取局部信息并合并到ViTs的嵌入中，改进了ViTs在小尺寸图像分类数据集上的性能，并推广到目标检测和语义分割等任务。同时，引入了一种新的可视化方法密集注意力Roll-Out，适用于密集预测任务。