MMM 和 MMMSynth:异构表格数据的聚类和合成数据生成
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文介绍了一种针对异构表格数据集的新算法MMM,用于聚类和合成数据生成。该算法使用EM-based聚类算法确定合成数据的聚类和恢复真实数据的结构。提出了一种名为MMMsynth的合成表格数据生成算法,该算法在测试中表现优异。
🎯
关键要点
-
该文介绍了一种针对异构表格数据集的新算法MMM。
-
MMM是一种创新的EM-based聚类算法,优于标准算法。
-
MMM算法用于确定合成异构数据的聚类和恢复真实数据的结构。
-
基于MMM,提出了合成表格数据生成算法MMMsynth。
-
MMMsynth通过预聚类和假定簇特定的数据分布生成合成数据。
-
算法在标准机器学习算法的基准测试中表现优异,接近真实数据训练的性能。
🏷️
标签
➡️