预测还是不预测?用于表格数据插补的按比例掩蔽自编码器
📝
内容提要
本研究解决了当前掩蔽自编码器在表格数据插补中面对的掩蔽分布不均的问题。我们提出了一种按比例掩蔽策略,确保生成的掩蔽与数据集中缺失值的统计特征一致,从而提升性能。同时,实验结果显示,基于简单多层感知器的标记混合方法在计算效率和性能上优于注意力机制,尤其适用于表格数据。此研究结果为缺失数据处理提供了新的视角。
🏷️
标签
➡️