本研究提出了AdaF^2M^2框架,旨在解决推荐系统中的长尾数据分布问题。该框架通过特征掩码机制和自适应权重,提升了特征表示学习和利用,显著改善了用户活跃度和应用持续时间。
本研究探讨了长尾数据分布问题,分析了监督对比学习、稀有类样本生成器和标签分布感知边际损失等技术的协同作用,发现这些技术的结合能够提高尾类准确率,同时保持主导类性能,实现各类的均衡改进。
蚂蚁数科在乌镇峰会推出了AI数据合成与生产平台AIGD,具备PB级数据生产能力,专注于生成稀缺的长尾数据以支持AI模型训练。该平台实现80%的自动化,能够合成多种模态数据,提高数据处理效率。业内普遍认为高质量数据是AI应用的基础,蚂蚁数科将持续投入AI ToB领域,推动产业发展。
本研究提出了一种新方法FedLF,旨在解决传统联邦学习在处理长尾数据时的类别偏差问题。通过自适应Logit调整和特征优化,FedLF有效提升了模型在尾类别上的性能,减轻了数据异构性带来的影响。
本文提出了一种新型表示学习框架CIDER,旨在优化ID-OOD可分离性,从而显著提高OOD检测性能。研究表明,特征的离散度和紧凑性对检测效果至关重要。通过引入负向感知范数(NAN)和校准异常类别学习(COCL),提升了长尾数据的异常检测能力,并在多个数据集上取得了最先进的结果。
本研究提出了多种新方法以提升类增量学习的性能,包括CwD、类增量新类别发现和基于嵌入的eCIL-MU框架。这些方法通过优化特征表示、引入混合类别和动态网络算法,显著提高了在长尾数据分布中的学习效果,实验结果在CIFAR-100和ImageNet数据集上表现优异。
本文介绍了多种图神经网络(GNN)模型及其在链接预测和节点分类中的应用,包括LTE4G、GraphLP、LAGCL和LinkGPT等。这些模型通过长尾增强、知识蒸馏和聚类等技术显著提升了性能,尤其在处理长尾数据和复杂图结构方面表现优异。
本文提出了多种解决长尾数据问题的方法,包括梯度感知的逻辑调整(GALA)损失、混淆矩阵建模、DropLoss和自适应损失。这些方法在多个数据集上验证了其有效性,显著提升了模型在长尾类别上的表现和泛化能力。
本文提出了一种新型隐私保护联邦学习方法,旨在解决异构和长尾数据的隐私问题。该方法通过分类器重新训练,在不泄露本地数据的情况下,实现与真实数据相当的性能。研究表明,针对数据不均衡和拜占庭攻击,提出的两层聚合方法有效提升了模型选择和全局聚合的效果。
完成下面两步后,将自动完成登录并继续当前操作。