小红花·文摘

为什么大多数人错误使用SMOTE，以及如何正确使用它

KDnuggets ·

避免过拟合、类别不平衡与特征缩放问题：机器学习从业者的笔记本

KDnuggets ·

如何诊断分类模型失败的原因

MachineLearningMastery.com ·

本研究提出了一种T2ID-CAS方法，以解决颈部超声解剖标志检测中的类别不平衡问题。该方法结合了潜在扩散模型和分类意识采样，实验结果显示平均精确度达到88.2%，显著高于基线的66%，展现了在超声引导干预中的应用潜力。

T2ID-CAS: A Diffusion Model and Classification-Aware Sampling Approach to Mitigate Class Imbalance in Neck Ultrasound Anatomical Landmark Detection

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的混合框架MetaBoost，以解决代谢综合症预测中的类别不平衡和数据稀缺问题。通过优化合成数据生成，模型准确率提升了1.14%。反事实分析显示，血糖和甘油三酯是降低代谢综合症风险的重要指标。

Enhancing Metabolic Syndrome Prediction through Hybrid Data Balancing and Counterfactual Analysis

BriefGPT - AI 论文速递 ·

本研究提出了一种增强标签的方法，以解决对抗训练中的分类性能不均衡问题。经过改进，模型的鲁棒性提高了53.50%，类别不平衡减少了5.73%，在干净样本和对抗样本的准确性上优于传统方法。

Narrowing the Gap in Class Robustness in Adversarial Training

BriefGPT - AI 论文速递 ·

本研究提出了一种基于视频的噪声感知自适应加权方法(V-NAW)，旨在解决面部表情识别中的标签模糊和类别不平衡问题。该方法通过自适应分配每帧的重要性，显著提升了识别性能。

Video-based Noise-aware Adaptive Weighting for Facial Expression Recognition

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的平衡细粒度正无标记学习框架（BFGPU），旨在解决文本分类中负文本的挑战，特别是在文本质量控制和法律风险筛选领域。该框架通过优化无标记学习损失函数，解决了类别不平衡问题，并在多个数据集上表现优越。

Micro Text Classification Based on Balanced Positive-Unlabeled Learning

BriefGPT - AI 论文速递 ·

本研究提出了一种结合不平衡感知技术的联合训练基准，以解决少样本增量学习中的类别不平衡问题，缩小基础类与增量类的性能差距，并规范了实验设置与评估流程。

针对少样本增量学习的新基准：重新定义上限

BriefGPT - AI 论文速递 ·

本研究探讨了可微神经符号推理的性能保障，揭示其在数据效率和可解释性方面的潜力。使用Scallop库，研究发现该方法在算术运算和高维输入下表现出较高的保障能力，并强调了解释性与对抗脆弱性之间的关系。在类别不平衡的推理问题中，数据效率的承诺通常得以体现。

On the Promise for Assurance of Differentiable Neurosymbolic Reasoning Paradigms

BriefGPT - AI 论文速递 ·

本研究提出了一种新的自适应框架OE-FSMC，旨在解决因隐私和安全问题导致的类别不平衡。该框架通过整合易获取的超出分布数据，成功平衡了训练分布，并验证了其在提升模型压缩精度方面的有效性。

Model Compression Using Limited Class Imbalanced Samples: An Out-of-Distribution Exploration

BriefGPT - AI 论文速递 ·

利用Inferium释放数据的潜力

DEV Community ·

本研究提出了一种新框架，利用大型语言模型和平衡检索增强生成组件，解决组织化政治运动中的类别不平衡问题。该方法通过智能提示设计，显著提高了社交媒体上虚假宣传活动的检测精度和召回率。

Network-informed Prompt Engineering Against Organized Disinformation Activities Under Extreme Class Imbalance

BriefGPT - AI 论文速递 ·

该研究提出了一种监督对比知识蒸馏框架（SCLIFD），旨在解决有限故障数据和类别不平衡下的渐进式故障诊断问题。通过改进表示学习、减少遗忘和优化示例选择，SCLIFD有效缓解了灾难性遗忘和类别不平衡，实验结果表明其在多种数据集上表现优越。

Class Incremental Fault Diagnosis under Limited Fault Data via Supervised Contrastive Knowledge Distillation

BriefGPT - AI 论文速递 ·

本研究探讨了大型预训练语言模型在代码漏洞检测中的应用，微调了四种开源模型并与中型模型进行了对比，展示了其在检测代码漏洞方面的潜力，尤其针对样本长度和类别不平衡问题。研究成果可供社区使用，推动该领域发展。

Research on the Application of Large Language Models in Code Vulnerability Detection: An Experimental Study

BriefGPT - AI 论文速递 ·

本文介绍了一系列主动学习方法，旨在提高语义分割任务的效率和准确性。这些方法通过引入新算法和损失函数，减少标注成本，同时提升模型在不同数据集上的性能，特别是在处理类别不平衡和提高少数类别识别能力方面表现突出。

基于上下文采样和一对其余熵的主动学习用于语义分割

BriefGPT - AI 论文速递 ·

本研究提出EXCON方法，旨在解决太阳耀斑预测中的类别不平衡问题。通过优化类间分离性和减少类内变异性，显著提升了分类性能。实验结果表明，EXCON在多个数据集上表现优异，具有广泛应用潜力。

EXCON: Application of Extreme Instance-based Contrastive Representation Learning for Severely Imbalanced Multivariate Time Series in Solar Flare Prediction

BriefGPT - AI 论文速递 ·

本研究提出了一种新框架，利用无限Laplacian特性解决半监督学习中的标签稀缺和类别不平衡问题，实验结果显示其分类准确性优于现有方法。

为什么大多数人错误使用SMOTE，以及如何正确使用它

避免过拟合、类别不平衡与特征缩放问题：机器学习从业者的笔记本

如何诊断分类模型失败的原因

T2ID-CAS: A Diffusion Model and Classification-Aware Sampling Approach to Mitigate Class Imbalance in Neck Ultrasound Anatomical Landmark Detection

Enhancing Metabolic Syndrome Prediction through Hybrid Data Balancing and Counterfactual Analysis

Narrowing the Gap in Class Robustness in Adversarial Training

Video-based Noise-aware Adaptive Weighting for Facial Expression Recognition

Micro Text Classification Based on Balanced Positive-Unlabeled Learning

针对少样本增量学习的新基准：重新定义上限

On the Promise for Assurance of Differentiable Neurosymbolic Reasoning Paradigms

Model Compression Using Limited Class Imbalanced Samples: An Out-of-Distribution Exploration

利用Inferium释放数据的潜力

Network-informed Prompt Engineering Against Organized Disinformation Activities Under Extreme Class Imbalance

Class Incremental Fault Diagnosis under Limited Fault Data via Supervised Contrastive Knowledge Distillation

Research on the Application of Large Language Models in Code Vulnerability Detection: An Experimental Study

基于上下文采样和一对其余熵的主动学习用于语义分割

EXCON: Application of Extreme Instance-based Contrastive Representation Learning for Severely Imbalanced Multivariate Time Series in Solar Flare Prediction

Graph-Based Semi-Supervised Isolation Lipschitz Learning

Conformal-in-the-Loop Method for Learning with Imbalanced Noisy Data

FedReMa: Improving Personalized Federated Learning by Leveraging the Most Relevant Clients