不牺牲速度改变基础:一种适用于深度神经网络的GPU高效替代矩阵乘法的方法
📝
内容提要
本研究提出了一种新的双线性算子替代深度神经网络中的矩阵乘法,解决了现有技术在推理加速中的不足。该算子在不减少(实际上增加)可训练参数数量的情况下,显著降低了计算量并提高了准确性。通过与最先进的基准比较,验证了本方法在计算效率和性能上的双重优势。
➡️
本研究提出了一种新的双线性算子替代深度神经网络中的矩阵乘法,解决了现有技术在推理加速中的不足。该算子在不减少(实际上增加)可训练参数数量的情况下,显著降低了计算量并提高了准确性。通过与最先进的基准比较,验证了本方法在计算效率和性能上的双重优势。