RISC-V RVV 对 ANN 算法的效率

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了在RISC-V平台上实现的Transformer模型的推理结果,通过优化算法和硬件设计实现了高速高效的计算。编码器模型实现了12.8倍的加速,解码器模型实现了35.6倍的加速。与专用加速器相比,FPU利用率提高了2.04倍。

🎯

关键要点

  • 在RISC-V平台上实现了Transformer模型的推理结果。

  • 通过优化算法和硬件设计实现了高速高效的计算。

  • 编码器模型实现了12.8倍的加速。

  • 解码器模型在非自回归模式下实现16.1倍加速,自回归模式下实现35.6倍加速。

  • FPU利用率提高了2.04倍,超过79%的利用率和294 GFLOPS/W的性能。

  • 实现了分布式Softmax原语和SIMD浮点操作数流,减少主内存访问延迟。

➡️

继续阅读