研究人员提出了一种简单而有效的数据增强方法,通过生成标记的真实图像的变体,进行生成性物体和背景增强,扩充现有的训练数据。背景增强尤其显著提高了模型的鲁棒性和泛化能力。该增强技术在不同场景下显著提升了模型的性能,为数据集增强的挑战提供了有希望的解决方案,为计算机视觉模型的发展做出了贡献。
本文介绍了一种名为You Only Cut Once(YOCO)的数据增强方法,通过将图像分为两个部分进行增强,提高了样本数据的多样性和神经网络的识别能力。YOCO易于使用、不需要调参,并可免费提升增强项的性能。实验证明,YOCO适应不同的数据增强方法和神经网络架构,并在CIFAR和ImageNet数据集上带来显著性能提升。此外,YOCO还可为对比学习的预训练提供更强大的表示,并在多个下游任务中更好地转移。研究还分析了YOCO的多种变体在不同设置下的性能表现。
该文章介绍了一种新的步态识别框架GaitASMS,能够提取自适应结构化空间表示和多尺度时间信息,并引入了数据增强方法random mask。在CASIA-B数据集上,该方法取得了93.5%的平均准确率,并在BG和CL上分别提高了3.4%和6.3%的rank-1准确率。消融实验证明了该方法的有效性。
本文介绍了一种名为SupFusion的新型训练策略,通过特征级监督和数据增强方法提升LiDAR-Camera融合的检测性能。实验证明该方法在KITTI基准测试中获得了约2%的3D mAP改进。
本文介绍了SemEval 2022 Task 11:MultiCoNER Multilingual Complex Named Entity Recognition中的成果,包括统一框架、数据增强方法和中文模型。系统在子任务11、12和9中获得了77.66、84.35和74.00的宏F1得分。
我们提出了一种名为BalanceMix的数据增强方法,用于解决多标签分类中的类别不平衡和噪声问题。该方法包括两个样本策略,用于生成多样性较高的少数类增强样本,并对多标签进行细分,将噪声标签归类为清晰、重新标记或不确定。实验结果表明,BalanceMix优于现有方法。
本文介绍了作者在SemEval共享任务9中预测亲密度水平的研究工作,使用多语言模型和语言特定的单语模型,并评估了数据增强方法。研究结果有价值。
最近邻高斯混合 (NNG-Mix) 是一种新算法,通过整合有标签和无标签数据生成伪异常样本,改进了半监督和监督异常检测算法。在57个数据集上,与常用的数据增强方法相比,取得了显著的性能提升。在ADBench中的经典、计算机视觉和自然语言处理数据集上,最多可提高16.4%、8.8%和8.0%。
该项目的背景是作者在玩游戏《原神》时发现了大量的异种文字,决定用计算机识别。作者使用Azure云服务平台的custom vision功能训练了一个自定义识别模型,并通过数据增强方法扩充了数据集。经过测试和优化,作者成功实现了对异种文字的识别,并通过小界面展示结果。该项目为实习机会提供给希望探索梦想的同学们。
本文通过基于次文化的数据增强方法解决情感分析训练数据不足问题,并验证了该方法的有效性和潜力。实验结果显示不同次文化表达方式引发的情绪刺激程度差异,并提出了某些次文化表达方式的线性可逆性猜想。希望该研究能够加强对信息、情感和文化融合的敏锐度,丰富集体理解力。
本文介绍了一种以可解释性显著图为中心的数据增强方法,用于提高结肠镜图像分割的深度学习模型的泛化能力。通过多中心多聚物检测数据集的测试,证明了该方法的有效性和多功能性。
本论文介绍了一种基于预训练掩码语言模型的条件联合建模框架,用于提高医学领域ASR系统的识别准确率。通过自适应技术和数据增强方法,该模型在字典和会话样式语料库上相对于基线模型实现了约5%的绝对改进和约10%的ASR输出优化。
完成下面两步后,将自动完成登录并继续当前操作。