本研究提出了一种基于随机抽样的简单算法,针对逻辑回归的二分类任务,确保高质量的预测概率近似。通过杠杆得分抽样,样本规模可显著小于总数据量,仍能实现准确近似,为大规模数据集提供高效解决方案。
本文提出了一种在大数据集上提高算法计算效率的采样方法,并评估了算法杠杆的统计性能。结果表明杠杆采样在最坏情况下能提供更好的结果。同时,本文还提出了两种新的杠杆算法,并在合成和真实数据集上进行了实证评估。
分层随机抽样是从大量群体中选择随机样本用于训练和测试数据集的方法。它通过将总体划分为较小的子组并从中随机选取样本,消除了样本数据集中存在的偏差。分层随机抽样有两种类型:按比例和不成比例。它的好处包括提高精度、增强比较和资源效率。分层随机抽样适用于市场研究、教育研究、健康研究等领域。在异质总体、显着变异性、比较分析、提高精度和人口研究等情况下,分层随机抽样比简单随机抽样更有效。
该文介绍了一种名为CARS的新方法,用于电力电子参数设计任务。该方法介于详细优化方法和快速模拟方法之间,能够快速进行大量模拟,并对最有前途的参数范围进行重点采样。在三个电力电子应用案例上进行了性能评估,得到的设计结果竞争力强于遗传算法,并且还能够支持高度并行化的模拟,以及探索性和开发性设置之间的连续进展。
完成下面两步后,将自动完成登录并继续当前操作。