本研究将卡拉茨巴算法扩展至矩阵乘法,设计了高效的硬件架构,显著降低了额外加法复杂度,提高了深度学习加速器的性能。
通过实现基于Python代码的“多项式整数索引乘法”算法,证明了该方法在一定位范围内的乘法比数论变换(NTT)和Karatsuba更快。同时,通过与多项式基数2整数方法进行比较,证明了任何整数或实数都可以表示为整数索引列表,代表二进制中的有限级数。整数索引的有限级数表示可以分布在多个CPU/GPU上进行存储和分发。证明了完全分布式计算方法可以克服并行乘法方法的当前限制,即需要共享共同的核心内存和磁盘来计算结果和中间结果。
完成下面两步后,将自动完成登录并继续当前操作。