MMM 和 MMMSynth:异构表格数据的聚类和合成数据生成

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文介绍了一种针对异构表格数据集的新算法MMM,用于聚类和合成数据生成。该算法使用EM-based聚类算法确定合成数据的聚类和恢复真实数据的结构。提出了一种名为MMMsynth的合成表格数据生成算法,该算法在测试中表现优异。

🎯

关键要点

  • 该文介绍了一种针对异构表格数据集的新算法MMM。

  • MMM是一种创新的EM-based聚类算法,优于标准算法。

  • MMM算法用于确定合成异构数据的聚类和恢复真实数据的结构。

  • 基于MMM,提出了合成表格数据生成算法MMMsynth。

  • MMMsynth通过预聚类和假定簇特定的数据分布生成合成数据。

  • 算法在标准机器学习算法的基准测试中表现优异,接近真实数据训练的性能。

➡️

继续阅读