小红花·文摘

本研究提出了群体相对知识蒸馏（GRKD）框架，解决了现有知识蒸馏方法忽视教师模型关系性归纳偏置的问题。GRKD通过关注类别之间的相对排名提炼教师知识，实验表明其在细粒度分类任务中具有更优的泛化能力。

Group Relative Knowledge Distillation: Learning from Teacher's Relational Inductive Bias

BriefGPT - AI 论文速递 ·

本研究提出Finer-CAM方法，旨在解决现有类激活图在区分相似细粒度类别时的不足。Finer-CAM通过比较目标类与相似类的差异，有效抑制共享特征，突出目标类的独特细节。研究表明，Finer-CAM在mask顶端激活像素时，相对置信度显著降低，展示了其在视觉解释中的潜力。

Finer-CAM: Spotting Differences Reveals Details in Visual Explanation

BriefGPT - AI 论文速递 ·

该研究提出了一种自适应提示调优方法，通过交叉注意力机制增强CLIP模型，以应对细粒度分类挑战。该方法动态调整文本提示，实现图像与文本特征的准确对齐，并在多个数据集上显著提升性能和模型预测的可靠性。

Adaptive Prompt Tuning: Vision-Guided Prompt Tuning with Cross-Attention for Fine-Grained Few-Shot Learning

BriefGPT - AI 论文速递 ·

本研究提出了一种层次多实例学习（HMIL）框架，旨在提高细粒度全切片图像分类的准确性。通过引入类级注意机制和监督对比学习，增强了模型的区分能力，取得了最新的性能表现，对精准肿瘤学具有重要意义。

HMIL: Hierarchical Multi-Instance Learning for Fine-Grained Whole Slide Image Classification

BriefGPT - AI 论文速递 ·

本文介绍了一种名为LRPABN的低秩双线性网络，旨在解决少样本学习中的细粒度分类问题。该模型通过双线性池化和特征对齐层学习有效的距离度量，并在多个数据集上表现优异。研究还提出了多种增强模型泛化能力和分类性能的方法，实验结果显示这些方法在少样本分类中具有显著优势。

少样本学习中的语义像素匹配的分层特征度量

BriefGPT - AI 论文速递 ·

本研究探讨了知识蒸馏的不同层次及其在模型压缩中的应用，提出了改进方法以提升学生模型的性能。实验证明，教师模型的质量和训练方式对知识蒸馏效果至关重要。此外，研究提出了一种基于比例分离的蒸馏方法，显著提高了细粒度分类任务的识别能力，并解决了错误监督问题。

精细化对数值蒸馏

BriefGPT - AI 论文速递 ·

本研究探讨了自动图像裁剪技术，提出了新数据集以评估算法表现。通过多种方法改进裁剪效果，特别是在高分辨率图像处理和细粒度分类上取得显著进展，展示了新模型在文档理解等任务中的优越性。

Cropper: 基于上下文学习的图像裁剪视觉语言模型

BriefGPT - AI 论文速递 ·

本文介绍了多种少样本学习的图像分类方法，如特征映射重建网络、DMN4模型和任务导向通道注意力方法。这些方法通过优化特征选择和增强模型性能，在多个基准数据集上实现了最高20%的准确性提升，特别在细粒度分类任务中表现优异。

一种简单的任务意识对比局部描述符选择策略用于少样本学习

BriefGPT - AI 论文速递 ·

本研究比较了遮蔽图像模型（MIM）与监督式预训练模型的表现，发现MIM在细粒度分类任务中表现优异。提出的A^2MIM框架通过研究补丁间相互作用提升了模型处理能力。MIMIR方法增强了Vision Transformers的鲁棒性，而MimCo框架则结合了MIM与对比学习，提高了预训练效果。此外，研究探讨了MIM在医学图像分析中的应用，显示其在监督学习中更快且精度更高。

AEMIM：对抗样本与遮蔽图像建模相遇

BriefGPT - AI 论文速递 ·

最近的研究揭示了大型视觉语言模型（LVLM）在细粒度视觉分类中的不足，并提出了多粒度属性评估基准。新框架CascadeVLM利用LVLM的知识，显著提高了细粒度图像分类的准确性。同时，研究探讨了CLIP模型的限制，并提出了改进策略，以增强细粒度属性检测和定位能力。

非洲还是欧洲的燕子？针对细粒度物体分类的大型视觉语言模型基准测试

BriefGPT - AI 论文速递 ·

本文介绍了多种基于CLIP模型的增强方法，如VT-CLIP、CPL、MP-FGVC和GeoCLIP，旨在提升视觉分类和定位性能。这些方法通过引入新技术和多模态协同推理，在细粒度分类和短语定位任务中取得了显著进展，展示了CLIP在视觉和语言任务中的广泛应用潜力。

ProGEO：通过图像 - 文本对比学习生成提示，用于视觉地理定位

BriefGPT - AI 论文速递 ·

本文介绍了一种新的分块式遮蔽图像建模（BIM）框架，旨在降低遮蔽图像建模（MIM）的计算资源需求，同时保持高性能。该框架支持多个深度神经网络的并发训练，降低计算成本。研究还探讨了双流视觉模型的开发，模拟人类视觉系统的处理方式，提升计算机视觉的鲁棒性和效率。此外，MIM与监督训练结合，改善了下游任务的学习表示质量，展现出在细粒度分类任务中的优势。

BIMM: 基于脑神经灵感的视频表示学习

BriefGPT - AI 论文速递 ·

本文介绍了一种基于视频的细粒度物体分类任务及新数据集，研究了多种深度卷积神经网络方法的适应性。提出的双卷积神经网络在多个图像分类基准测试中表现优异，结合视觉注意力和概率图模型，提高了细粒度分类的准确性和效率。

DCNN: 双交流深度神经网络的实现与微观对象识别的交互式深度学习判别器

BriefGPT - AI 论文速递 ·

该研究提出了一种多标签零样本学习的神经网络模型，利用嵌入矩阵和加权损失函数提升图像检索质量。模型在多个数据集上测试表现优异，尤其在细粒度分类和视觉-语言模型应用中，显著提高了零样本学习的准确性。

拥抱多样性：超过每个类别一个向量的可解释零 - shot 分类

BriefGPT - AI 论文速递 ·

本文介绍了多种基于深度学习的物体部位检测和分类方法，如PDD、PartNet、DP-FCN和ProtoPNet。这些方法通过分析卷积神经网络的输出，提升了细粒度分类和目标检测的性能，并在多个数据集上取得了优异的结果。

DP-Net：学习图像识别的区别性部分

BriefGPT - AI 论文速递 ·

最近的研究揭示了大型视觉语言模型在细粒度视觉分类中的不足，并提出了多粒度属性评估基准。通过细调扩散模型，显著改善了文本与图像的对齐能力，尤其在物体属性和空间关系的理解上有效提升了模型性能。

FINEMATCH：基于方面的细粒度图像与文本不匹配检测与校正

BriefGPT - AI 论文速递 ·

本文探讨了基于掩码图像建模的MAE预训练方法（MAE-lite），分析其在轻量级视觉Transformer（ViTs）中的应用效果。研究表明，MIM在细粒度分类任务中表现优异，并提出了MIMDet检测器，显著提升了检测性能。通过特征蒸馏，增强了预训练方法的微调性能，强调了学习表示的普适性和可扩展性。

观察、分析与解决：通过带掩码图像建模预训练探索强大轻量化视觉 Transformer

BriefGPT - AI 论文速递 ·

本研究探讨了细粒度分类在物种鉴定中的应用，比较了不同深度学习模型的表现。混合模型在准确性上优于其他模型，而完全转换器模型在推断速度上更快。研究还提出了多阶段的 Vision Transformer 框架和新的分类方法，展示了其在生物多样性研究中的潜力。

基于众包昆虫图像的细粒度分类的计算机视觉算法性能

BriefGPT - AI 论文速递 ·

本研究探讨了多模态视觉-语言模型的选择与预测，提出了LOVM基准测试。分析了视觉模型在识别任务中的应用，提出自适应集成方法以提高零样本分类性能，并介绍了BIKE框架以增强视频识别。研究表明，利用大型语言模型生成的描述可改善细粒度分类，且地理先验对零样本分类有效。

填补视觉语言模型选择中的模态和容量差距

BriefGPT - AI 论文速递 ·

该研究提出了多种新方法以提升视觉-语言模型在少样本类增量学习和细粒度视觉分类中的性能，包括构建高质量的遥感图像字幕数据集（RSICap）和新的零样本学习框架（FGVP）。实验结果显示，这些方法在多个基准测试中优于传统技术，显著提高了模型的泛化能力和分类准确性。

大规模视觉语言模型用于细粒度船舶分类的高效提示调整

BriefGPT - AI 论文速递 ·