本文介绍了随机矩阵算法理论的最新进展及其在大规模数据分析中的应用,重点关注了统计上的杠杆作用概念,可用于识别异常值和开发更好的矩阵算法,解决线性最小二乘和低秩矩阵逼近问题。
本文提供了Nyström方法用于求解不定核的低秩矩阵逼近的数学完整证明,并提出了一种高效的方法来寻找这种核矩阵的近似特征分解,以此构建可在再现核Krein空间中学习的高度可扩展方法。这些方法提供了一种有原则的并且理论基础良好的方法来解决大规模关于不定核的学习问题。本文的主要动机来自于具有结构表示的问题,在这些问题上,根据直觉和/或领域专家的知识很容易设计出一对一的(不)相似度函数。这些函数通常不是正定形的,并且超出了实践者的专业知识范围。本文使用不定核构建在结构化和向量化数据表示中,通过经验证明了这些方法的有效性。
完成下面两步后,将自动完成登录并继续当前操作。