小红花·文摘 - 小红花技术领袖俱乐部

算法对决：逻辑回归 vs. 随机森林 vs. XGBoost 在不平衡数据上的表现

算法对决：逻辑回归 vs. 随机森林 vs. XGBoost 在不平衡数据上的表现

MachineLearningMastery.com ·

本研究提出了一种新颖的类感知梯度屏蔽聚合策略，旨在提升非独立同分布数据环境下联邦学习的聚合性能。该方法通过动态加权客户端贡献，增强隐私保护，提高了对不平衡数据和攻击的鲁棒性。实验结果表明，该策略优于传统的FedAvg方法。

Privacy-Preserving and Robust Aggregation in Cross-Island Federated Learning under Non-Independent and Identically Distributed Environments

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，解决了联邦学习中非独立同分布和不平衡数据导致的全模型调优效率低的问题。通过优化输入前缀的小集合，结合联邦学习与提示调优，实验结果表明该方法在处理数据异质性方面优于现有方法，具有重要应用价值。

Probabilistic Federated Prompt-Tuning with Non-IID and Imbalanced Data

BriefGPT - AI 论文速递 ·

本研究提出了一种通用微调方法PoGDiff，旨在提升扩散模型在不平衡数据集上的表现。通过高斯乘积替代真实分布，增强生成的准确性和质量，有效缓解不平衡问题。

Product Gaussian Diffusion Model for Imbalanced Text-to-Image Generation

BriefGPT - AI 论文速递 ·

本文定义了ε安全决策区域，以确保数据驱动分类器的预测可靠性。研究表明，当数据来自指数族分布时，该区域可解析且可控。同时，开发了多成本支持向量机算法以处理不平衡数据，并近似安全区域。实验和代码的提供增强了研究的可重复性。

指数族分布的ε安全决策区域的精确表征与多成本支持向量机近似

BriefGPT - AI 论文速递 ·

本研究强调顺序上下文在行为建模中的重要性，提出了一种基于隐马尔可夫模型的序列建模框架，能够有效处理不平衡和稀缺数据。

基于集成学习的行为序列建模

BriefGPT - AI 论文速递 ·

本文探讨了差分隐私（DP）在神经网络训练中的应用，特别是在处理不平衡类别数据时的挑战。研究发现，DP-SGD算法可能导致模型准确率不公平，并加剧性别、种族和宗教偏见。通过反事实数据增强法，可以在保护隐私的同时改善模型的公平性。此外，研究评估了不同隐私级别对模型公平性的影响，并提出了优化隐私与效用平衡的策略。

差分隐私对预训练自然语言处理模型偏见的影响吗？

BriefGPT - AI 论文速递 ·

本研究提出了一种动态软剪枝方法GDeR，旨在解决不平衡或偏见数据模式下的性能下降问题。GDeR通过可训练的原型更新数据子集，显著提高了模型性能和训练速度，尤其在不平衡和噪声训练情境中表现优于其他剪枝方法。

GDeR: Safeguarding Efficiency, Balance, and Robustness via Prototypical Graph Pruning

BriefGPT - AI 论文速递 ·

本文探讨了不平衡数据分类中的重新采样技术及其对分类性能的影响。研究表明，过采样方法能提升分类准确性，阈值补偿在特定场景下也有效。提出了一种新型损失函数，根据类别难度动态分配样本权重，实验结果优于传统方法。此外，分析了不同采样技术的有效性，并提出自动最优采样策略选择模型，扩展了神经坍缩现象，揭示了类别加权的实际好处。

何时重采样/重加权能改善不平衡分类中的特征学习？玩具模型研究

BriefGPT - AI 论文速递 ·

本文探讨了基于深度强化学习的不平衡数据分类模型，强调其在少数样本识别中的优越性能。研究了公平强化学习的最新进展，提出了多智能体系统中的公平性方法，并分析了算法公平性在不同应用中的表现。实验结果表明，所提框架在处理不平衡数据时显著提高了分类准确性和公平性。

平衡天平：公平分类的强化学习

BriefGPT - AI 论文速递 ·

本文提出了一种有效处理不平衡数据集中噪声标签的方法，结合类平衡样本选择和置信度样本增强，通过模型训练动态纠正噪声标签，提升模型性能。实验结果表明，该方法在高噪声水平下优于现有技术，具有良好的鲁棒性和准确性。

促进具噪声标签学习中的适应性与平衡

BriefGPT - AI 论文速递 ·

本文探讨了分布鲁棒优化（DRO）在机器学习中的应用，提出多种算法以提升模型的鲁棒性和泛化能力。研究显示，这些算法在处理不平衡数据和超大数据集时表现优异，有效克服了传统风险最小化方法的局限性，实验结果验证了其有效性。

通过凹面最大化寻找最优鲁棒数据混合

BriefGPT - AI 论文速递 ·

机器学习中处理不平衡数据的技巧

机器学习中处理不平衡数据的技巧

MachineLearningMastery.com ·

本文提出了多种情感识别模型，包括基于图卷积网络和多模态融合的网络，旨在提高对话中的情感识别效果。这些模型在多个基准数据集上表现优异，尤其在处理不平衡数据和多种情感时具有显著优势。

上下文感知孪生网络在会话中高效的情感识别

BriefGPT - AI 论文速递 ·

本文探讨了机器学习中分类系统的性能指标，比较了MCC、F1和FM得分的优劣，强调了在处理不平衡数据时的有效性。研究提出了新方法解决二分类器中的类不平衡问题，并通过实验验证了其在医学影像等领域的应用效果，提升了模型的准确性和效率。

不平衡分类问题的鲁棒性能指标

BriefGPT - AI 论文速递 ·

数据增强（DA）在图像分类中显著提升模型性能，但效果因类别而异，可能导致某些类别准确率下降。研究表明，DA能改善模型的泛化能力，尤其在处理不平衡数据时。提出的目标数据增强（TDA）方法通过引入偏见，成功降低偏见度量并提升性能。比较多种增强技术后发现，神经增强方法有效提升分类器性能。

图像数据增强中的类别特定偏差数据驱动方法

BriefGPT - AI 论文速递 ·

该研究提出了一种适用于高维基因表达二分类的鲁棒加权评分方法（ROWSU），通过解决类分布不平衡问题，提高分类算法性能。该方法优于k最近邻和随机森林分类器的特征选择算法。

基于鲁棒加权评分的特征选择方法用于高维二元类不平衡基因表达数据

BriefGPT - AI 论文速递 ·

本文提出了一种针对 UNSW-NB15 数据集的机器学习分类器的数据驱动设计和性能评估方法，使用 Balanced Bagging、eXtreme Gradient Boosting、Hellinger Distance Decision Tree 等集成方法来解决不平衡数据问题，提出了两种新的算法来解决类重叠问题，并提高了测试数据的分类性能。

基于嵌套交叉验证的高速列车系统机器学习负载均衡的新方法

BriefGPT - AI 论文速递 ·

本文讨论了情感识别的挑战和机遇，介绍了情感分类法和处理主观性注释的方法。重点讲述了深度学习方法和处理不平衡数据的技巧。最后，描述了关键ERC工作和基准测试，并比较了它们在不同数据集上的性能。强调了解决不平衡数据、探索多种情感和融入注释主观性的好处。

从口到腹：解决任务型对话情感识别学习的关键步骤

BriefGPT - AI 论文速递 ·

该论文提出了一种基于语义对抗攻击的方法SIA，通过在预定义的语义属性空间和图像空间上的迭代梯度上升来结合语义追踪和感知质量，解释和分析模型缺陷。该方法在模型诊断、攻击成功率和不平衡数据鲁棒性方面具有应用前景。

语义通信系统中的模型反转窃听攻击

BriefGPT - AI 论文速递 ·