当大数据实际上是低秩的,或者是某个函数生成的矩阵的逐个近似
原文中文,约2000字,阅读约需5分钟。
📝
内容提要
本文研究了通过对两个m维变量的光滑函数进行采样生成的矩阵的低秩逼近。作者否定了先前文献中的一个论点,并提出了三个更窄的函数类别,可以在与维度m无关的情况下以逐个元素误差逼近。作者还将论点扩展到了由m维变量的多线性积生成的张量的低秩张量列逼近。
🎯
关键要点
-
本文研究了通过对两个m维变量的光滑函数进行采样生成的矩阵的低秩逼近。
-
否定了先前文献中关于特定类别解析函数的论点,认为这些矩阵可以独立于m进行准确的逐个元素的秩逼近。
-
提出了三个更窄的函数类别,使得生成的矩阵可以在与维度m无关的情况下以逐个元素误差逼近。
-
扩展了论点至由m维变量的多线性积生成的张量的低秩张量列逼近。
-
在Transformer神经网络的注意力低秩逼近的背景下讨论了研究结果。
❓
延伸问答
什么是低秩逼近?
低秩逼近是指通过对矩阵或张量进行简化,使其秩降低,从而在保持重要信息的同时减少计算复杂度。
本文提出了哪些新的函数类别?
本文提出了三个更窄的函数类别,使得生成的矩阵可以在与维度m无关的情况下以逐个元素误差逼近。
作者如何否定先前文献中的论点?
作者否定了先前文献中关于特定类别解析函数的论点,认为这些矩阵可以独立于m进行准确的逐个元素的秩逼近。
研究结果在Transformer神经网络中有什么应用?
研究结果在Transformer神经网络的注意力低秩逼近的背景下进行了讨论,表明其在深度学习中的潜在应用。
低秩逼近的逐个元素误差是如何计算的?
逐个元素误差的计算涉及到O(log(n)ε^(-2) polylog(ε^(-1)))的复杂度,确保在与维度m无关的情况下进行逼近。
本文扩展了哪些内容到张量的低秩逼近?
作者将论点扩展到了由m维变量的多线性积生成的张量的低秩张量列逼近。
🏷️