ClustEm4Ano:用于微数据匿名化的名义文本属性的文本嵌入聚类
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
该研究提出了ClustEm4Ano,一个针对名义文本表格数据的匿名化管道,通过迭代聚类生成语义相近的值,从而显著提升匿名数据集的质量。
🎯
关键要点
- 该研究提出了ClustEm4Ano,一个用于名义文本表格数据的匿名化管道。
- ClustEm4Ano旨在解决现有方法在生成值一般化层次(VGHs)方面的局限性。
- 该方法通过迭代聚类生成语义相近的值一般化,提升了匿名化效果。
- 实验结果表明,ClustEm4Ano在保持小k-匿名性时,显著改善了匿名数据集的质量。
🏷️
标签
➡️