小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
算法对决:逻辑回归 vs. 随机森林 vs. XGBoost 在不平衡数据上的表现

本文讨论了逻辑回归、随机森林和XGBoost在处理不平衡数据时的表现,强调了不平衡数据带来的挑战,如模型偏见和误导性指标。介绍了三种算法的优缺点及应对策略,包括类权重、重采样和阈值调整。逻辑回归适合线性关系,随机森林适合非线性,而XGBoost在复杂数据集上表现优异。选择最佳模型需考虑数据特性和业务目标。

算法对决:逻辑回归 vs. 随机森林 vs. XGBoost 在不平衡数据上的表现

MachineLearningMastery.com
MachineLearningMastery.com · 2025-10-03T14:11:09Z

本研究提出了一种新颖的类感知梯度屏蔽聚合策略,旨在提升非独立同分布数据环境下联邦学习的聚合性能。该方法通过动态加权客户端贡献,增强隐私保护,提高了对不平衡数据和攻击的鲁棒性。实验结果表明,该策略优于传统的FedAvg方法。

Privacy-Preserving and Robust Aggregation in Cross-Island Federated Learning under Non-Independent and Identically Distributed Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究提出了一种创新方法,将联邦学习与提示调优结合,以提高在非独立同分布和不平衡数据下的全模型调优效率。实验结果表明,该方法在处理数据异质性方面优于现有技术,具有重要的应用价值。

基于非独立同分布和不平衡数据的概率联邦提示调优

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z

本研究提出了一种通用微调方法PoGDiff,旨在提升扩散模型在不平衡数据集上的表现。通过高斯乘积替代真实分布,增强生成的准确性和质量,有效缓解不平衡问题。

产品高斯扩散模型用于不平衡文本到图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z

本文定义了ε安全决策区域,以提高数据驱动分类器的预测可靠性。研究表明,该区域在指数族分布下可解析,并可通过设计参数进行控制。同时,开发了多成本支持向量机算法以处理不平衡数据,并近似安全区域。

指数族分布的ε安全决策区域的精确表征与多成本支持向量机近似

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z

该研究提出了一种鲁棒加权评分方法(ROWSU),用于处理高维基因表达二分类的不平衡数据,从而提升分类性能。通过平衡数据集和选择最小基因子集,该方法在特征选择上优于kNN和随机森林算法。

用于微阵列数据分类的进化神经网络框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z

本研究强调顺序上下文在行为建模中的重要性,提出了一种基于隐马尔可夫模型的序列建模框架,能够有效处理不平衡和稀缺数据。

基于集成学习的行为序列建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出动态软剪枝方法GDeR,通过可训练的原型更新机制,采样出代表性、平衡和无偏的子集,提升模型性能和训练速度。实验显示,GDeR在不平衡和噪声环境中表现优于其他方法。

GDeR:通过原型图剪枝保障效率、平衡性和鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

测试时间适应(TTA)在不平衡数据上表现不佳,导致性能下降。研究提出了平衡的batchnorm层,结合自我训练(ST)和锚定损失正则化,提升适应性。最终模型TRIBE在四个数据集上表现优异,代码可在GitHub获取。

Meta-TTT:一种用于测试时训练的元学习最小最大框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

该研究提出了一种新的框架,通过学习理论和浓度不等式解决传统解决方案的不足。该方法利用置信区间嵌入学习过程,以类依赖的方式理解不确定性,适应不同类别间的不平衡程度变化,提供稳健可靠的分类结果。实证结果显示,该框架为处理不平衡数据的分类任务提供了有希望的方向,为构建准确可信的模型提供了有价值的工具。

学习不平衡数据分类的置信界限

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z
机器学习中处理不平衡数据的技巧

机器学习中,不完美的数据是常态。不平衡的数据可能导致模型选择偏差,影响模型性能和公平性。解决不平衡数据问题的方法包括重采样、适当的评估指标、算法调整和数据增强。决策树和集成方法如随机森林和梯度提升可以通过类别加权来处理不平衡数据。综合多种策略可以提高模型性能和公平性。

机器学习中处理不平衡数据的技巧

MachineLearningMastery.com
MachineLearningMastery.com · 2024-05-24T10:28:26Z

本文通过推导一种用于从不平衡数据中训练分类器的集成学习方法,比较了与其他标准方法在从二元混合数据中训练线性分类器的情况下学习不平衡数据的性能。结果表明,增加多数类别的大小可以提高性能,特别是当少数类别的大小较小时。与之相反,US 的性能不随多数类别的大小变化而变化,而 SW 的性能则随不平衡程度的增加而降低,表明集成和对参数的直接正则化之间存在固有差异。

对装袋不足进行复制分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-15T00:00:00Z

该文章讨论了情感识别的挑战和机遇,介绍了情感分类法和处理主观性注释的方法。重点介绍了深度学习方法以及处理任务性能指标和不平衡数据的方法。还描述了关键工作和基准测试,并比较了它们在不同数据集上的方法和性能。强调了利用技术解决不平衡数据、探索多种情感和在学习阶段融入注释主观性的好处。

CKERC:面向会话中情感识别的联合大型语言模型与常识知识

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-12T00:00:00Z

该研究提出了一种适用于高维基因表达二分类的鲁棒加权评分方法(ROWSU),通过解决类分布不平衡问题,提高分类算法性能。该方法优于k最近邻和随机森林分类器的特征选择算法。

基于鲁棒加权评分的特征选择方法用于高维二元类不平衡基因表达数据

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-23T00:00:00Z

本文提出了一种针对 UNSW-NB15 数据集的机器学习分类器的数据驱动设计和性能评估方法,使用 Balanced Bagging、eXtreme Gradient Boosting、Hellinger Distance Decision Tree 等集成方法来解决不平衡数据问题,提出了两种新的算法来解决类重叠问题,并提高了测试数据的分类性能。

基于嵌套交叉验证的高速列车系统机器学习负载均衡的新方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-02T00:00:00Z

本文讨论了情感识别的挑战和机遇,介绍了情感分类法和处理主观性注释的方法。重点讲述了深度学习方法和处理不平衡数据的技巧。最后,描述了关键ERC工作和基准测试,并比较了它们在不同数据集上的性能。强调了解决不平衡数据、探索多种情感和融入注释主观性的好处。

从口到腹:解决任务型对话情感识别学习的关键步骤

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-24T00:00:00Z

该论文提出了一种基于语义对抗攻击的方法SIA,通过在预定义的语义属性空间和图像空间上的迭代梯度上升来结合语义追踪和感知质量,解释和分析模型缺陷。该方法在模型诊断、攻击成功率和不平衡数据鲁棒性方面具有应用前景。

语义通信系统中的模型反转窃听攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-08T00:00:00Z

本文介绍了使用虚无假设检验来评估机器学习模型的效果,并探讨了不平衡数据和平均分布数据对基准线评估的影响。同时,介绍了比较演算法的其他推论统计检定方法。最后,提出了如何评估机器学习模型的问题。

機器學習模型真的準嗎?從虛無假設檢定來檢驗模型成效 / Applying Null-Hypothesis Statistical Testing on Machine Learning Model Evaluation

布丁布丁吃什麼?
布丁布丁吃什麼? · 2023-05-31T04:00:00Z

本文提出了一种新的聚合损失Top-K Loss,它可以更好地拟合不同的数据分布,特别是在多分布数据和不平衡数据中,可以更好地保护小类样本,并且损失仍然是凸函数,具有很好的可优化性质,但实验结果尚未取得更好的结果。

一文详解ATK Loss论文复现与代码实战

华为云官方博客
华为云官方博客 · 2023-02-27T07:17:49Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码