小红花·文摘

研究人员提出了一种简单而有效的数据增强方法，通过生成标记的真实图像的变体，进行生成性物体和背景增强，扩充现有的训练数据。背景增强尤其显著提高了模型的鲁棒性和泛化能力。该增强技术在不同场景下显著提升了模型的性能，为数据集增强的挑战提供了有希望的解决方案，为计算机视觉模型的发展做出了贡献。

一种用于物体检测的简单背景增强方法与扩散模型

BriefGPT - AI 论文速递 ·

该文章介绍了一种新的步态识别框架GaitASMS，能够提取自适应结构化空间表示和多尺度时间信息，并引入了数据增强方法random mask。在CASIA-B数据集上，该方法取得了93.5%的平均准确率，并在BG和CL上分别提高了3.4%和6.3%的rank-1准确率。消融实验证明了该方法的有效性。

基于注意力的形状和步态表示学习方法对基于视频的更衣人物再识别

BriefGPT - AI 论文速递 ·

本文介绍了一种名为SupFusion的新型训练策略，通过特征级监督和数据增强方法提升LiDAR-Camera融合的检测性能。实验证明该方法在KITTI基准测试中获得了约2%的3D mAP改进。

混合尺度监督用于高效标签的基于 LiDAR 的三维物体检测

BriefGPT - AI 论文速递 ·

本文介绍了SemEval 2022 Task 11：MultiCoNER Multilingual Complex Named Entity Recognition中的成果，包括统一框架、数据增强方法和中文模型。系统在子任务11、12和9中获得了77.66、84.35和74.00的宏F1得分。

2023 年 VLSP 的 ComOM：基于 BERTology 和统一多任务指导调优模型的越南比较意见挖掘的双阶段框架

BriefGPT - AI 论文速递 ·

我们提出了一种名为BalanceMix的数据增强方法，用于解决多标签分类中的类别不平衡和噪声问题。该方法包括两个样本策略，用于生成多样性较高的少数类增强样本，并对多标签进行细分，将噪声标签归类为清晰、重新标记或不确定。实验结果表明，BalanceMix优于现有方法。

多标签分类的鲁棒性：对抗不平衡和噪声的数据增强策略

BriefGPT - AI 论文速递 ·

本文介绍了作者在SemEval共享任务9中预测亲密度水平的研究工作，使用多语言模型和语言特定的单语模型，并评估了数据增强方法。研究结果有价值。

使用多语言转换器集成的文本亲密度分析

BriefGPT - AI 论文速递 ·

最近邻高斯混合 (NNG-Mix) 是一种新算法，通过整合有标签和无标签数据生成伪异常样本，改进了半监督和监督异常检测算法。在57个数据集上，与常用的数据增强方法相比，取得了显著的性能提升。在ADBench中的经典、计算机视觉和自然语言处理数据集上，最多可提高16.4%、8.8%和8.0%。

NNG-Mix: 利用伪异常生成改进半监督异常检测

BriefGPT - AI 论文速递 ·

该项目的背景是作者在玩游戏《原神》时发现了大量的异种文字，决定用计算机识别。作者使用Azure云服务平台的custom vision功能训练了一个自定义识别模型，并通过数据增强方法扩充了数据集。经过测试和优化，作者成功实现了对异种文字的识别，并通过小界面展示结果。该项目为实习机会提供给希望探索梦想的同学们。

用Azure干出个原神异种文字翻译器

dotNET跨平台 ·

本文通过基于次文化的数据增强方法解决情感分析训练数据不足问题，并验证了该方法的有效性和潜力。实验结果显示不同次文化表达方式引发的情绪刺激程度差异，并提出了某些次文化表达方式的线性可逆性猜想。希望该研究能够加强对信息、情感和文化融合的敏锐度，丰富集体理解力。

情感分析是否需要亚文化？一种新的数据增强方法

BriefGPT - AI 论文速递 ·

本文介绍了一种以可解释性显著图为中心的数据增强方法，用于提高结肠镜图像分割的深度学习模型的泛化能力。通过多中心多聚物检测数据集的测试，证明了该方法的有效性和多功能性。

基于可解释性引导的数据增强技术用于多中心结肠镜数据的鲁棒分割

BriefGPT - AI 论文速递 ·

本论文介绍了一种基于预训练掩码语言模型的条件联合建模框架，用于提高医学领域ASR系统的识别准确率。通过自适应技术和数据增强方法，该模型在字典和会话样式语料库上相对于基线模型实现了约5%的绝对改进和约10%的ASR输出优化。

一种适用于中文医学标点恢复的小型且快速的 BERT 模型

BriefGPT - AI 论文速递 ·