本研究提出了一种基于内部表示的统一度量——亲和力与多样性,以解决演示选择方法在不同优化目标下的不一致性问题。实验结果表明,该度量与测试准确率显著相关,促进了演示选择的一致性。
本研究探讨了数据增强对隐私数据保护的影响,提出了防御框架ARMOR,能够有效保持数据的不可学习性。实验结果表明,ARMOR能将增强样本训练模型的测试准确率降低60%以上,从而显著提升数据隐私保护能力。
该研究提出了一种新算法,结合动态规划和分支界限法,优化连续特征数据的分类树结构。实验结果显示,该算法的运行时间比现有方法快一个数量级,测试准确率提高了5%。
本文探讨信息平面在量子学习模型中的应用,提出通过压缩输入数据的信息量来优化学习算法,采用损失函数的乘法正则化和学习率调度器两种方法。实验结果显示,该算法提高了测试准确率和收敛速度。
该文介绍了一种新的分层联邦学习方法 - 分层独立子模型训练(HIST),通过将全局模型划分为不相交的子模型,并将它们分布在不同的细胞中来解决分层环境下的计算、存储和通信负担问题。作者证明了 HIST 对于非凸损失函数的收敛行为,并展示了几个属性对性能效率权衡的影响。数值实验验证了 HIST 能够大幅节省通信成本,并实现相同的目标测试准确率。
DEEM是一种用于小麦营养缺陷分类挑战的方法,将数据集分成不同日期的离散组来训练模型,并采用伪标签方法将高置信度的测试数据标记并纳入训练集,最终将各组的模型统一获得整个数据集的模型。在Deep Nutrient Deficiency Challenge中,该方法获得了平均93.6%的Top-1测试准确率,并荣获了第一名。
DiffPrep是一种自动搜索适用于给定表格数据集和可微分机器学习模型的数据预处理流水线的方法。通过将搜索空间转化为连续、可微分的空间来高效求解,只需训练一次机器学习模型即可进行流水线搜索。实验结果表明,DiffPrep在18个真实数据集中有15个取得了最佳的测试准确率,并将模型的测试准确率提高了多达6.6个百分点。
本文比较了六个机器学习算法在乳腺癌数据集上的分类测试准确性,结果显示所有算法表现良好,超过90%的测试准确率,其中MLP算法表现最佳,测试准确率高达99.04%。
完成下面两步后,将自动完成登录并继续当前操作。