泄漏对机器学习管道中数据协调的影响:针对跨场所类别不平衡的研究
发表于: 。本研究解决了在不同条件下获取的数据集可能带来的不必要的场所特异性变异这一问题。提出了一种名为PrettYharmonize的新方法,通过伪装目标标签来协调数据,避免数据泄漏。研究表明,该方法在处理真实世界的MRI和临床数据时,相较于易受泄漏影响的方法,能有效保持性能,特别是在场所相关性场景中。
本研究解决了在不同条件下获取的数据集可能带来的不必要的场所特异性变异这一问题。提出了一种名为PrettYharmonize的新方法,通过伪装目标标签来协调数据,避免数据泄漏。研究表明,该方法在处理真实世界的MRI和临床数据时,相较于易受泄漏影响的方法,能有效保持性能,特别是在场所相关性场景中。