该研究提出了SMOGAN框架,旨在解决不平衡回归中预测变量偏斜的问题,显著提升了合成样本的质量和模型性能,实验结果表明其优于传统方法。
该论文提出了一种针对性的监督对比学习方法(TSC),旨在提高长尾识别中少数类的识别准确率。通过优化特征向量分布,改善类别边界和模型的泛化能力,实验结果表明TSC在多个数据集上表现优异。
本文提出了文本嫁接框架,综合了弱监督文本分类、伪标签、LLM和少数类数据合成的优势。通过使用LLM挖掘掩码模板并填充合成文本,改进了挖掘或合成少数类数据的效果。通过分析和案例研究来理解文本嫁接的特性。
本文提出了量子SMOTE方法,通过使用量子计算技术解决机器学习数据集中的类别不平衡问题。该方法利用量子过程生成合成数据点,使得少数类数据点能够产生合成实例。算法引入了旋转角度、少数类比例和分割因子等超参数,使合成数据生成过程具备更大的控制性和定制化。在TelecomChurn数据集上与随机森林和逻辑回归进行比较评估,验证了该方法在不同比例的合成数据下的影响。
该文提出了两个新的贡献,解决不平衡分类框架中的主要挑战,即类别尺寸微不足道,需要重新缩放风险函数。这些发现更清楚地了解了类别加权在实际情况下的好处,并为该领域的进一步研究开辟了新的途径。
完成下面两步后,将自动完成登录并继续当前操作。