基于最小化不一致性的评分数据缺失值填充算法
原文中文,约200字,阅读约需1分钟。发表于: 。本研究在不同应用中使用六个真实数据集,分析缺失值模式以及插补算法的适用条件。基于分析得到的结构和属性,我们提出了优化模型和算法,在仅使用已知评分信息的情况下最小化评分提供者之间的总评分不一致性,用于插补组合评分列表中的缺失评分。实验结果表明,所提出的方法在插补准确性方面优于文献中的现有通用插补方法。
该研究提出了一种对待处理缺失数据的机器学习模型建模的对比学习框架,通过学习不完整样本与其完整对应物之间的相似性和其他样本之间的不相似性来解决现有方法中的三个主要缺点,并引入了可解释技术来可视化学习过程和诊断模型状态。结果表明该方法在不需要填充缺失值的情况下具有高预测准确性和模型可解释性。