ViT(视觉变换器)通过将图像分割为小块并利用自注意力机制,成为计算机视觉领域的重要模型。尽管缺乏先验知识,但在大数据集上表现优越。Swin Transformer在此基础上进一步改进,适应多尺度特征,提升检测和分割效果。
本研究提出CFIS-YOLO模型,旨在解决木材缺陷检测中的高成本和主观性问题。该模型通过增强结构和新损失函数,提高了多尺度特征融合和小物体定位能力,在公共数据集上达到了77.5%的mAP,验证了其在资源受限环境中的有效性。
本研究提出Nes2Net架构,直接处理高维语音特征,显著提升多尺度特征提取能力,实验结果显示性能提升22%,计算成本降低87%。
本研究提出了一种基于注意力的多尺度时间融合网络,用于多模式过程中的故障诊断。该方法通过提取多尺度特征和时间注意力机制,提高了诊断准确性,实验结果表明其性能优越且模型体积小。
本研究针对视觉复杂性建模中的可解释性问题,提出了多尺度特征以克服传统模型的局限,并引入新的SVG数据集,强调数据特性在理解视觉复杂性中的重要性。
本研究提出了一种新型肺结节分割模型S3TU-Net,结合多维空间连接和超像素视觉变换器,利用结构化卷积块和多尺度特征融合技术,显著提升了分割性能。实验结果显示,S3TU-Net在LIDC-IDRI数据集上表现优于现有方法。
本研究提出了VMGNet模型,旨在解决深度学习机器人抓取技术的高计算复杂度问题。该模型通过引入视觉状态空间,实现线性计算复杂度,并通过多尺度特征融合提升准确性。实验结果表明,抓取成功率达到94.4%。
本研究提出了一种尺度感知图注意力视觉变换器(SAG-ViT),旨在提高视觉变换器在多尺度特征表示中的效率。该模型通过优化节点嵌入,在图像分类任务中显著提升了性能。
本文提出了新框架MSTA3D,旨在解决3D实例分割中的过度分割问题,尤其是大物体的分割。MSTA3D结合多尺度特征、双注意力机制、箱体查询和正则化,实验结果在多个数据集上优于现有方法。
Transformer在图像超分辨率任务中表现优异,但传统方法计算复杂度高。论文提出HiT-SR策略,通过分层窗口和空间-通道相关方法,提高多尺度特征聚合效率。HiT-SR利用扩展窗口和线性复杂度方法,改善长距离依赖。实验显示,HiT-SR在性能、参数和速度上优于现有方法,速度提升约7倍。
本文介绍了多种医学图像分割方法,如SA2-Net、MFA-Net、MCANet和MS-Twins,利用多尺度特征学习和注意力机制提高分割精度。这些新模型在处理复杂医学图像时表现优于传统方法,能够更好地捕捉上下文信息和细粒度特征。
本研究提出了一种新型图像匹配方法Dual-Branch Transformer,利用不同尺寸的图像块学习多尺度特征,从而提升图像匹配性能。该方法在ImageNet1K数据集上表现优异,具备强大的特征提取能力和较低的计算复杂度。
本文提出了一种新型的像素级全景分割方法,适用于卫星图像时间序列,利用时序注意力机制提取多尺度特征。同时,开发了公开的卫星图像数据集PASTIS,并展示了该方法在语义分割任务中的优越表现。
本文介绍了一种基于深度学习的单图像去反射新方法,该方法利用位置感知和多尺度特征,显著提高了反射去除效果。研究表明,该方法在多个数据集上优于现有技术,具有良好的应用前景。
本文探讨了视觉地点识别(VPR)的新定义及其挑战,介绍了基于Transformer的模型TransVPR,提升了多尺度特征聚合和全局视觉特征的性能。研究提出了通用VPR解决方案,显著提高了识别精度,并分析了图像分辨率对VPR的影响,旨在推动VPR在商业应用中的发展。
本文提出了一种基于图卷积神经网络的三维人体姿态估计方法,结合多尺度特征和迭代图滤波,优化了计算效率和精度。实验结果表明,该方法在多个基准数据集上超越了现有技术,具有实际应用价值。
研究表明,深度显著性模型在视觉对象识别中优于传统模型,尤其在自然图像上。通过卷积神经网络提取多尺度特征并结合上下文信息,能有效提高视觉显著性预测的准确性。该方法适用于资源受限的应用,并在多个基准测试中表现良好。
FocalClick 提出了一种交互式分割模型,能够通过快速推理实现目标区域的粗细分割,显著降低 FLOP,并优化点击率预测的无模型预训练框架。研究还介绍了多尺度特征传播网络和基于变分推断的概率融合网络,提升了语义分割的性能和鲁棒性。
本文研究了卷积神经网络中的多尺度特征表示,提出了新型网络架构SFANet和MAFFSRN,以提高图像分割和超分辨率性能。实验结果表明,这些方法在多个数据集上表现优异,且参数需求和计算成本较低。
本文提出了一种新型无监督测试时训练(TTT)技术,通过最大化多尺度特征图与离散潜在表示之间的相互信息,整合到标准训练中。实验结果表明,该方法在不同测试时适应基准上表现出竞争力的分类性能。
完成下面两步后,将自动完成登录并继续当前操作。