该论文介绍了一种新的 Winograd 算法,扩展了其在复数领域的应用,并提出了优化方法以提高效率。研究设计了基于整数的过滤器缩放方案,减少模型大小并加快推理速度。比较不同卷积实现方式后发现,FFT 实现通常优于 Winograd 方法。此外,提出了实时数据无需模型压缩的框架 SQuant,显著提高了量化精度。
完成下面两步后,将自动完成登录并继续当前操作。