本文介绍了一种基于自注意力块的局部信息增强模块LIFE,通过提取局部信息并合并到ViTs的嵌入中,改进了ViTs在小尺寸图像分类数据集上的性能,并推广到目标检测和语义分割等任务。同时,引入了一种新的可视化方法密集注意力Roll-Out,适用于密集预测任务。
完成下面两步后,将自动完成登录并继续当前操作。