本文介绍了如何使用Scikit-Learn的Imputer模块处理缺失数据,以简化数据科学项目。通过使用Scikit-Learn的imputer类,可以用特定值替换缺失数据,并探索处理缺失数据的几种策略。可以使用Simple Imputer填充列的缺失值,也可以使用K-NN Imputer使用最近邻方法填充缺失数据。最后,还介绍了基于迭代模型的Iterative Impute方法。
本文介绍了一种名为Imputer的神经序列模型,通过插值迭代生成输出序列。Imputer是一种迭代生成模型,通过动态规划训练算法,可以近似边际化输入和输出序列之间的对齐和生成顺序。在端到端语音识别中,Imputer优于非自回归模型,并与自回归模型取得竞争性结果。在LibriSpeech test-other上,Imputer的成绩为11.1 WER,优于CTC的13.0 WER和seq2seq的12.5 WER。
完成下面两步后,将自动完成登录并继续当前操作。