小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
为什么大多数人错误使用SMOTE,以及如何正确使用它

SMOTE是一种解决机器学习类别不平衡问题的数据增强技术,通过在少数类样本间插值生成合成样本,帮助平衡数据集。使用时需先划分训练和测试集,以防数据泄漏。常见误用包括过度平衡和忽视评估指标的上下文。

为什么大多数人错误使用SMOTE,以及如何正确使用它

KDnuggets
KDnuggets · 2026-02-11T16:21:32Z
避免过拟合、类别不平衡与特征缩放问题:机器学习从业者的笔记本

机器学习面临过拟合、类别不平衡和特征缩放等挑战。过拟合可通过交叉验证检测,增加训练数据可改善模型表现。类别不平衡可通过调整类权重和重采样策略解决。特征缩放确保输入特征对模型训练的贡献均衡。理解这些问题及其解决方案是提升模型性能的关键。

避免过拟合、类别不平衡与特征缩放问题:机器学习从业者的笔记本

KDnuggets
KDnuggets · 2026-01-14T14:56:26Z
如何诊断分类模型失败的原因

分类模型失败的原因包括性能指标分析、类别不平衡、数据质量差、过拟合与欠拟合,以及概念漂移。通过混淆矩阵和多种评估指标可以诊断模型表现。处理类别不平衡可采用过采样或欠采样技术,确保数据质量和特征相关性,避免错误标签和不匹配数据。同时,监测数据漂移,及时更新模型以适应新数据。

如何诊断分类模型失败的原因

MachineLearningMastery.com
MachineLearningMastery.com · 2025-08-18T13:59:54Z

本研究提出了一种T2ID-CAS方法,以解决颈部超声解剖标志检测中的类别不平衡问题。该方法结合了潜在扩散模型和分类意识采样,实验结果显示平均精确度达到88.2%,显著高于基线的66%,展现了在超声引导干预中的应用潜力。

T2ID-CAS: A Diffusion Model and Classification-Aware Sampling Approach to Mitigate Class Imbalance in Neck Ultrasound Anatomical Landmark Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本研究提出了一种新颖的混合框架MetaBoost,以解决代谢综合症预测中的类别不平衡和数据稀缺问题。通过优化合成数据生成,模型准确率提升了1.14%。反事实分析显示,血糖和甘油三酯是降低代谢综合症风险的重要指标。

Enhancing Metabolic Syndrome Prediction through Hybrid Data Balancing and Counterfactual Analysis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本研究提出了一种增强标签的方法,以解决对抗训练中的分类性能不均衡问题。经过改进,模型的鲁棒性提高了53.50%,类别不平衡减少了5.73%,在干净样本和对抗样本的准确性上优于传统方法。

Narrowing the Gap in Class Robustness in Adversarial Training

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了一种基于视频的噪声感知自适应加权方法(V-NAW),旨在解决面部表情识别中的标签模糊和类别不平衡问题。该方法通过自适应分配每帧的重要性,显著提升了识别性能。

Video-based Noise-aware Adaptive Weighting for Facial Expression Recognition

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了一种新颖的平衡细粒度正无标记学习框架(BFGPU),旨在解决文本分类中负文本的挑战,特别是在文本质量控制和法律风险筛选领域。该框架通过优化无标记学习损失函数,解决了类别不平衡问题,并在多个数据集上表现优越。

Micro Text Classification Based on Balanced Positive-Unlabeled Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z

本研究提出了一种结合不平衡感知技术的联合训练基准,以解决少样本增量学习中的类别不平衡问题,缩小基础类与增量类的性能差距,并规范了实验设置与评估流程。

针对少样本增量学习的新基准:重新定义上限

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-13T00:00:00Z

本研究探讨了可微神经符号推理的性能保障,揭示其在数据效率和可解释性方面的潜力。使用Scallop库,研究发现该方法在算术运算和高维输入下表现出较高的保障能力,并强调了解释性与对抗脆弱性之间的关系。在类别不平衡的推理问题中,数据效率的承诺通常得以体现。

On the Promise for Assurance of Differentiable Neurosymbolic Reasoning Paradigms

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

本研究提出了一种新的自适应框架OE-FSMC,旨在解决因隐私和安全问题导致的类别不平衡。该框架通过整合易获取的超出分布数据,成功平衡了训练分布,并验证了其在提升模型压缩精度方面的有效性。

Model Compression Using Limited Class Imbalanced Samples: An Out-of-Distribution Exploration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-09T00:00:00Z
利用Inferium释放数据的潜力

Inferium是一款创新的数据预处理和分析工具,旨在简化数据处理流程,解决类别不平衡等常见问题,帮助用户高效处理复杂数据工作流,适应快速发展的AI技术,节省时间,专注于实际问题的解决。

利用Inferium释放数据的潜力

DEV Community
DEV Community · 2025-01-26T11:04:02Z

本研究提出了一种新框架,利用大型语言模型和平衡检索增强生成组件,解决组织化政治运动中的类别不平衡问题。该方法通过智能提示设计,显著提高了社交媒体上虚假宣传活动的检测精度和召回率。

Network-informed Prompt Engineering Against Organized Disinformation Activities Under Extreme Class Imbalance

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-21T00:00:00Z

该研究提出了一种监督对比知识蒸馏框架(SCLIFD),旨在解决有限故障数据和类别不平衡下的渐进式故障诊断问题。通过改进表示学习、减少遗忘和优化示例选择,SCLIFD有效缓解了灾难性遗忘和类别不平衡,实验结果表明其在多种数据集上表现优越。

Class Incremental Fault Diagnosis under Limited Fault Data via Supervised Contrastive Knowledge Distillation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-16T00:00:00Z

本研究探讨了大型预训练语言模型在代码漏洞检测中的应用,微调了四种开源模型并与中型模型进行了对比,展示了其在检测代码漏洞方面的潜力,尤其针对样本长度和类别不平衡问题。研究成果可供社区使用,推动该领域发展。

Research on the Application of Large Language Models in Code Vulnerability Detection: An Experimental Study

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本文介绍了一系列主动学习方法,旨在提高语义分割任务的效率和准确性。这些方法通过引入新算法和损失函数,减少标注成本,同时提升模型在不同数据集上的性能,特别是在处理类别不平衡和提高少数类别识别能力方面表现突出。

基于上下文采样和一对其余熵的主动学习用于语义分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出EXCON方法,旨在解决太阳耀斑预测中的类别不平衡问题。通过优化类间分离性和减少类内变异性,显著提升了分类性能。实验结果表明,EXCON在多个数据集上表现优异,具有广泛应用潜力。

EXCON: Application of Extreme Instance-based Contrastive Representation Learning for Severely Imbalanced Multivariate Time Series in Solar Flare Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究提出了一种新框架,利用无限Laplacian特性解决半监督学习中的标签稀缺和类别不平衡问题,实验结果显示其分类准确性优于现有方法。

Graph-Based Semi-Supervised Isolation Lipschitz Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

本研究提出了一种名为“循环保形方法”(CitL)的新方法,旨在解决大规模数据集中的类别不平衡和标签噪声问题。通过评估样本的不确定性,该方法显著提高了模型的鲁棒性和准确性,分类准确率提升了6.1%。

不平衡噪声数据学习的循环保形方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出了一种新算法FedReMa,旨在解决个性化联邦学习中的类别不平衡问题。通过自适应共学习和多样聚合策略,该算法显著提升了模型的精度,实验结果表明其在数据异质性挑战中表现优越。

FedReMa:通过利用最相关的客户来改善个性化联邦学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码