本研究提出了一种基于注意力的学习框架(ACTLL),旨在解决电子健康记录中医疗时间序列数据的标签错误问题。该方法通过动态校准不确定标签和增强已确认实例,提高了患者结果预测的准确性。实验结果表明,在高噪声情况下,该模型优于现有技术。
本研究提出了一种自适应标签平滑方法IVON,旨在解决标签平滑中的设计难题,处理标签错误和数据分布变化,其性能优于传统方法。
数据质量对模型性能至关重要。CleanLab提供系统化的方法来识别和修正数据集中的标签错误,利用线性模型、支持向量机、随机森林和XGBoost等算法有效提升数据清洗效果,软投票集成方法进一步增强模型预测能力。
本研究探讨了自然语言处理基准数据集的标签质量问题,提出利用大语言模型检测标签错误。研究表明,纠正这些错误能显著提升模型性能,说明模型的不足主要源于标签问题,而非模型本身。
该文介绍了ProcSim框架,通过建立类别本体和创建语义一致的标签错误,训练鲁棒的深度度量学习模型。实验结果表明,该方法在深度度量学习基准数据集上取得了最先进的性能。
本文研究了标签错误对模型不平衡指标的影响,并提出了一种估算训练输入标签影响的方法。结合自动重新标记和微调策略,能够显著改善模型的不平衡指标和群体校准误差。
该文介绍了一种资源高效的数据清洗协议,用于识别数字皮肤病学中基准数据集中的问题。该协议利用现有的算法清洗策略,并在直观的终止准则下进行确认过程。通过多位皮肤科医生的确认,移除了不相关的样本和近似重复,并估计了六个皮肤科图像数据集中标签错误的百分比。该工作为数字皮肤病学中更可靠的性能评估铺平了道路。
完成下面两步后,将自动完成登录并继续当前操作。