通用逼近理论:神经网络并行性的基础
原文中文,约200字,阅读约需1分钟。发表于: 。当前深度学习模型序列化,增加层次会导致训练和推理时间的增加。因此,本文提出了一种基于通用逼近定理(UAT)的深度学习并行化策略,设计了一个名为 Para-Former 的并行网络来验证理论。与传统序列模型不同,Para-Former 的推理时间不会随着层次数增加而增加,从而显着加快了多层网络的推理速度。实验结果证实了该网络的有效性。
本文提出了一种基于通用逼近定理的深度学习并行化策略,设计了一个名为Para-Former的并行网络,有效地加快了多层网络的推理速度。