小型医学数据集中的聚类潜在空间人工数据点生成
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对小型医学数据集的不足,提出了一种新的人工数据点生成方法AGCL,通过在聚类潜在空间中生成合成数据来提升分类性能。应用于帕金森病筛查的实验表明,该方法在提高分类准确率方面效果显著,最终在不同情感分类中实现了83.33%的测试准确率和90.90%的交叉验证准确率,显示了其在小型数据集增强中的潜在影响。
我们开发了一种新算法用于异构表格数据的聚类和合成数据生成。MMM算法在聚类和数据结构恢复上优于传统方法。MMMsynth算法通过预聚类和假设簇特定分布生成合成数据,测试显示其效果优于其他生成器,并接近真实数据的训练效果。