小红花·文摘

本文提出了一种基于Vision Transformer (ViT)架构的任务内互注意方法，用于少样本学习。该方法通过交换支持集和查询集的类别标记与图像片段标记，实现了互注意，加强了类内表征，促进了同一类别样本之间的相似性。在五个常见的少样本分类基准任务中，该方法在5-shot和1-shot情况下表现更好，同时具有简单、高效的计算能力。