小红花·文摘

本研究提出了一种名为GradMix的新数据增强方法，旨在解决持续学习中保持旧知识与获取新知识的挑战。GradMix通过基于梯度的选择性混合样本，显著减少了分类增量学习中的灾难性遗忘，实验结果表明其在多种数据集上的准确性优于传统方法。

GradMix: Gradient-based Selective Mixup for Robust Data Augmentation in Class-Incremental Learning

BriefGPT - AI 论文速递 ·

本研究提出了一种半监督学习方法，利用音频源定位引导的混合技术，解决视频动作识别中的高注释成本问题。该方法结合视觉和音频信息，尽管标记数据量少，仍能显著提升在UCF-51、Kinetics-400和VGGSound数据集上的表现，具有重要应用潜力。

Semi-Supervised Audio-Visual Action Recognition with Audio Source Localization Guided Mixup

BriefGPT - AI 论文速递 ·

本研究提出了TdAttenMix，通过结合人类注视信息改进CutMix方法，有效解决标签不一致问题。实验结果表明，其在八个基准测试中优于现有方法。

TdAttenMix: Top-Down Attention-Guided Mixup Enhancement

BriefGPT - AI 论文速递 ·

本文介绍了低训练数据指令调优（LTD Instruction Tuning）方法，旨在减少大型语言模型（LLMs）指令调优的数据使用，提高效率。研究表明，使用少于0.5%的数据可训练出性能提升2%的模型。此外，提出顺序指令调整策略以增强模型在复杂任务中的表现，并探讨了数据偏差对模型性能的影响，提出分阶段指令微调方法以提高指令遵循能力。

SFTMix：通过Mixup法提高语言模型的指令调优

BriefGPT - AI 论文速递 ·

本研究提出了一种新预处理策略ProxiMix，结合mixup方法和偏见缓解算法，改善数据增强的公平性。实验表明，ProxiMix在预测和公平性补救方面表现优异。

ProxiMix: Enhancing Subgroup Fairness through Proximal Sample Augmentation

BriefGPT - AI 论文速递 ·

本文介绍了CroSSL、TriMix、DiffMix等多种自监督学习和半监督学习的新方法，旨在提升模型在少量标注数据下的性能。这些方法在多模态学习、连续学习和分类准确率方面表现优于现有技术，尤其在低数据情况下效果显著。

CroMo-Mixup: 提升增量式自我监督学习的跨模型表示

BriefGPT - AI 论文速递 ·

本研究提出了多种基于Mixup的方法，如IntraMix、ifMixup、S-Mixup和Global Mixup，以增强图神经网络（GNN）的性能和鲁棒性。这些方法通过插值和数据增强技术，提高了节点分类和图分类的准确性，解决了低质量标记数据的问题，显著提升了GNN的泛化能力。实验结果显示，这些新方法在多个基准测试中表现优异。

GeoMix：面向几何感知数据增强

BriefGPT - AI 论文速递 ·

本文研究了一种改进的知识蒸馏方法，通过动态调整教师模型权重，提升学生模型在自然语言处理任务中的性能。采用多任务学习和Mixup数据扩充技术，显著增强了模型的表达能力和泛化能力。实验结果显示，动态知识蒸馏和多语种训练技术在多个基准测试中表现优异，尤其在低资源语言处理上取得了显著提升。

特权学生：关于多语言知识蒸馏中初始化价值的研究

BriefGPT - AI 论文速递 ·

本文探讨了数据增强技术Mixup在自然语言处理中的应用，实验表明其显著提升了预训练语言模型的性能。研究提出了DoubleMix、Infinite Class Mixup和Global Mixup等多种改进方法，这些方法在文本分类任务中表现优越，增强了模型的鲁棒性和泛化能力。

混合增强与多种插值

BriefGPT - AI 论文速递 ·

该研究提出了一种多标签学习方法，旨在提升自然语言处理任务的表现。通过处理噪声标签，提出了同时学习注释器模型和真实标签分布的策略。实验结果显示，该方法在图像分类和文本分类任务中表现优异，有效估计注释器技能并提升模型性能。

Annot-Mix: 通过 Mixup 扩展从多个注释者的嘈杂标签中学习

BriefGPT - AI 论文速递 ·

本文探讨了数据增强技术Mixup在自然语言处理中的应用，尤其是在transformer模型中的效果。研究表明，Mixup显著提升了预训练语言模型的性能。此外，文章提出了针对隐私学习的新型增强技术DP-Mix_Self和DP-Mix_Diff，并介绍了自动混合框架AutoMix及其在多个基准上的优越表现。

TransformMix: 从数据中学习变换和混合策略

BriefGPT - AI 论文速递 ·

本文提出了一种新的基于Transformer的MIL方法，探索形态和空间信息，对三个计算病理学问题进行了测试，结果表明该方法具有更好的性能和更快的收敛速度，测试AUC可以达到93.09％，在TCGA-NSCLC和TCGA-RCC数据集上，癌症亚型分类的AUC分别可以达到96.03％和98.82％。

MixUp-MIL：基于线性和多线性插值数据增强的组织切片图像分类研究

BriefGPT - AI 论文速递 ·

通过增强传统的SMOTE方法并与Mixup结合，提出了一种统一的深度学习数据增强框架。实验结果表明该方法在深度不平衡分类任务上具有最先进的性能，并且在极度不平衡数据上也达到了优异的效果。

从 SMOTE 到 Mixup 的深度不平衡分类

BriefGPT - AI 论文速递 ·

R-Mix是一种新方法，将随机性和显著性结合起来，实现了速度、简单性和准确性的平衡。该方法训练了一个基于分类器性能的混合策略决策代理，减少了对人类设计目标和超参数调整的依赖，并展示了优越的泛化、弱监督目标定位、校准和对抗性攻击鲁棒性。

RankMixup: 基于排名的 Mixup 网络校准训练

BriefGPT - AI 论文速递 ·

本文介绍了一种新型的混合增强方法，称为结构混合（S-Mixup），用于节点分类。该方法考虑了结构信息，在混合节点时利用图神经网络（GNN）分类器为无标签节点获取伪标签及其预测置信度，并利用从GNN训练中获得的边梯度提出了一种基于梯度的边选择策略。实验证明S-Mixup在节点分类任务中提高了GNN的鲁棒性和泛化性能，尤其是在异质情况下。

S-Mixup: 图神经网络的结构混合

BriefGPT - AI 论文速递 ·

本文介绍了数据增强方法CutMix和Mixup的实践案例，提供了离线和在线实现代码。这两种方法能够很好地代表了目前数据增强的一些方法，掌握了这两种方法，也就理解了另外的cutout以及mosaic增强方法。

CutMix&Mixup详解与代码实战

华为云官方博客 ·