MMM 和 MMMSynth:异构表格数据的聚类和合成数据生成
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文介绍了一种针对异构表格数据集的新算法MMM,用于聚类和合成数据生成。该算法使用EM-based聚类算法确定合成数据的聚类和恢复真实数据的结构。提出了一种名为MMMsynth的合成表格数据生成算法,该算法在测试中表现优异。
🎯
关键要点
- 该文介绍了一种针对异构表格数据集的新算法MMM。
- MMM是一种创新的EM-based聚类算法,优于标准算法。
- MMM算法用于确定合成异构数据的聚类和恢复真实数据的结构。
- 基于MMM,提出了合成表格数据生成算法MMMsynth。
- MMMsynth通过预聚类和假定簇特定的数据分布生成合成数据。
- 算法在标准机器学习算法的基准测试中表现优异,接近真实数据训练的性能。
🏷️
标签
➡️