本研究提出了群体相对知识蒸馏(GRKD)框架,解决了现有知识蒸馏方法忽视教师模型关系性归纳偏置的问题。GRKD通过关注类别之间的相对排名提炼教师知识,实验表明其在细粒度分类任务中具有更优的泛化能力。
本研究提出Finer-CAM方法,旨在解决现有类激活图在区分相似细粒度类别时的不足。Finer-CAM通过比较目标类与相似类的差异,有效抑制共享特征,突出目标类的独特细节。研究表明,Finer-CAM在mask顶端激活像素时,相对置信度显著降低,展示了其在视觉解释中的潜力。
该研究提出了一种自适应提示调优方法,通过交叉注意力机制增强CLIP模型,以应对细粒度分类挑战。该方法动态调整文本提示,实现图像与文本特征的准确对齐,并在多个数据集上显著提升性能和模型预测的可靠性。
本研究提出了一种层次多实例学习(HMIL)框架,旨在提高细粒度全切片图像分类的准确性。通过引入类级注意机制和监督对比学习,增强了模型的区分能力,取得了最新的性能表现,对精准肿瘤学具有重要意义。
本文介绍了一种名为LRPABN的低秩双线性网络,旨在解决少样本学习中的细粒度分类问题。该模型通过双线性池化和特征对齐层学习有效的距离度量,并在多个数据集上表现优异。研究还提出了多种增强模型泛化能力和分类性能的方法,实验结果显示这些方法在少样本分类中具有显著优势。
本研究探讨了知识蒸馏的不同层次及其在模型压缩中的应用,提出了改进方法以提升学生模型的性能。实验证明,教师模型的质量和训练方式对知识蒸馏效果至关重要。此外,研究提出了一种基于比例分离的蒸馏方法,显著提高了细粒度分类任务的识别能力,并解决了错误监督问题。
本研究探讨了自动图像裁剪技术,提出了新数据集以评估算法表现。通过多种方法改进裁剪效果,特别是在高分辨率图像处理和细粒度分类上取得显著进展,展示了新模型在文档理解等任务中的优越性。
本文介绍了多种少样本学习的图像分类方法,如特征映射重建网络、DMN4模型和任务导向通道注意力方法。这些方法通过优化特征选择和增强模型性能,在多个基准数据集上实现了最高20%的准确性提升,特别在细粒度分类任务中表现优异。
本研究比较了遮蔽图像模型(MIM)与监督式预训练模型的表现,发现MIM在细粒度分类任务中表现优异。提出的A^2MIM框架通过研究补丁间相互作用提升了模型处理能力。MIMIR方法增强了Vision Transformers的鲁棒性,而MimCo框架则结合了MIM与对比学习,提高了预训练效果。此外,研究探讨了MIM在医学图像分析中的应用,显示其在监督学习中更快且精度更高。
最近的研究揭示了大型视觉语言模型(LVLM)在细粒度视觉分类中的不足,并提出了多粒度属性评估基准。新框架CascadeVLM利用LVLM的知识,显著提高了细粒度图像分类的准确性。同时,研究探讨了CLIP模型的限制,并提出了改进策略,以增强细粒度属性检测和定位能力。
本文介绍了多种基于CLIP模型的增强方法,如VT-CLIP、CPL、MP-FGVC和GeoCLIP,旨在提升视觉分类和定位性能。这些方法通过引入新技术和多模态协同推理,在细粒度分类和短语定位任务中取得了显著进展,展示了CLIP在视觉和语言任务中的广泛应用潜力。
本论文研究了细粒度分类、物种识别、计算机视觉、深度卷积网络和视觉转换器。通过评估9种算法,发现视觉转换器在推理速度和计算成本方面表现最佳,局部性视觉转换器在性能和嵌入质量方面超过其他算法,卷积神经网络具有折中性。
本文介绍了一种利用分类卫星图像时间序列绘制农作物地图的方法,通过将专家知识编码至神经网络中,提高了细粒度分类的性能。实验证明,该方法在分类性能上至少提高了9.9个百分点。
本研究提出了一种新的计算机视觉方法ViTree,用于细粒度视觉分类。该方法结合了流行的视觉转换器和神经决策树,通过选择补丁和路径来改进表示,并提高模型的可解释性。实验证明,ViTree在性能和可解释性方面超越了竞争对手。
本文介绍了一种利用分类卫星图像时间序列绘制农作物地图的方法,通过编码专家知识至卷积循环神经网络中,提高了细粒度分类性能,实验结果显示分类性能提高了9.9个百分点。
本文研究了在无约束视觉环境下的细粒度分类任务,通过使用强大的视觉网络替代传统的RNN结构,并在大规模预训练的情况下训练模型,成功实现了比谷歌网络分类模型更好的效果。该模型能够自主学习并区分各类狗的品种,无需边界框等空间监督,具备端对端训练的优势。
CrisisMatch是一种半监督少样本学习条件下的细粒度灾害推文分类模型,利用少量标注数据和大量无标注数据有效地将推文分类为感兴趣的细粒度类别。通过集成有效的半监督学习方法和引入TextMixUp,CrisisMatch在两个灾害数据集上平均提升了11.2%的性能。
该文介绍了一种基于自监督学习的表示优化技术,可以改进细粒度分类和分割任务的性能。该技术利用部分特异变化来改进 fine-grained 分类,并在卷积和视觉变换网络中聚类像素表示。通过部分中心化学习和对比,在图像中对部分进行聚类,提高了图像分类和部分分割任务的性能。该技术在多个数据集上展示了良好的性能。
该文介绍了一种利用专家知识的农作物分类方法,将三级标签层次结构编码至卷积循环神经网络中,提高了细粒度分类的性能。实验表明,该模型在新的公共数据集上的分类性能至少提高了9.9个百分点。
完成下面两步后,将自动完成登录并继续当前操作。