TabTransformer是一种基于自注意力变换器的深度表格数据建模架构,适用于监督和半监督学习,表现优越且具备良好的鲁棒性和可解释性。SubTab框架通过特征子集提升学习效果,I-JEPA框架引入自我监督学习增强图像表示,MTR数据增广方法提高模型性能。此外,研究探讨了生成性AI在表格数据增强中的应用,提升数据质量与多样性。
本文探讨了利用生成合成图像解决深度学习模型在工业制造中视觉质量检测的稳定性问题。研究表明,生成对抗网络在数据增广中表现最佳,并提出了一个综合性的图片异常检测基准,以评估多种算法的性能。通过引入生成模型和领域知识,优化了训练数据生成流程,验证了其在工业应用中的有效性。
本文研究了生成对抗平衡网络(GCFN)在反事实公平性下的预测方法,提出了新框架CLAIRE,通过反事实数据增广和不变化惩罚来减轻敏感属性偏差。研究表明,该方法在多种数据集上表现优越,有效避免机器学习中的不公正决策。
该论文介绍了多种改进的推荐系统方法,包括基于时间间隔的数据增广、序列表示学习和用户属性利用等,均在真实数据集上验证了其优越性能。这些方法通过不同的模型和任务设计,提升了个性化推荐效果,解决了数据稀疏性和用户偏好变化等问题。
本文提出了一种新的无监督表示学习框架,通过数据增广生成新样本,优化对比损失函数,从而提升时间序列预测的表现。实验结果表明,该方法在单变量和多变量时间序列上均优于其他方法,并对临床时间序列的迁移学习具有积极影响。
本文介绍了多种基于生成模型的自然语言处理技术,如比较关系提取、数据增广和对比学习框架,旨在提高文本生成和理解的准确性与性能。研究表明,精心设计的数据集和新方法能显著提升模型表现。
本文介绍了自适应图片转换学习器(AITL)等新方法,以提高对抗样本的可转移性。研究结合数据增广和元学习,显著提升攻击成功率。提出的攻击方法如Admix和AAIT在不同数据集上验证了其有效性,增强了对抗性传递性。
本文探讨了通过数据增广和优化方法改善深度学习模型的公平性和分类性能,特别是针对少数群体的偏见问题。研究表明,使用加权数据增强和选择性微调可以显著提高模型在不同子人群中的表现,且无需额外数据或注释。这些方法在多个基准测试中达到了最先进的准确性和训练效率。
该论文提出了一种无监督去偏差技术,利用聚类算法识别伪属性,并通过聚类加权调整学习去偏置表示。研究表明,该方法在多个基准测试中表现优异,甚至与有监督方法相当。此外,提出了基于特征级数据增广的去偏方法和公平性框架,以平衡公平性与效用。
本文探讨了卷积神经网络(CNN)在纹理表示和分类中的应用,提出通过数据增广来减弱纹理偏见,从而提升测试表现。研究评估了CNN的特征提取能力,发现其在物体识别中更依赖纹理而非形状,并总结了纹理分析在计算机视觉中的重要性及应用。
知识蒸馏(KD)机制在大型语言模型(LLM)中起关键作用,将专有模型的功能传输到开源模型。调查讨论了KD机制、认知能力增强和实际应用,展示了数据增广和KD之间的关系,促进可持续的人工智能解决方案。
数据增广通过随机化参数在每个训练周期生成不同的图像,以提高模型的泛化能力。本文以Fashion-MNIST为例,展示了如何使用PyTorch实现数据增广,包括图像裁剪和色调调整,并通过加载数据集和绘制图像验证增广效果。
完成下面两步后,将自动完成登录并继续当前操作。