cuBLAS GEMM API在列主序和行主序矩阵中的使用

💡 原文英文,约800词,阅读约需3分钟。
📝

内容提要

cuBLAS GEMM API对输入输出矩阵的存储格式有严格要求。若矩阵为列主序格式,可直接使用;若为行主序格式,设置参数时易出错。本文讨论了矩阵转置与列主序存储的关系,以及在不同情况下如何使用cuBLAS GEMM API。

🎯

关键要点

  • cuBLAS GEMM API对输入输出矩阵的存储格式有严格要求。
  • 列主序格式的矩阵可以直接使用,行主序格式的矩阵在设置参数时容易出错。
  • 本文讨论了矩阵转置与列主序存储的关系。
  • cuBLAS单精度GEMM API的声明格式和功能介绍。
  • 如果矩阵以行主序格式存储,必须进行转置才能使用cuBLAS进行矩阵乘法。
  • 在某些情况下,可以通过转置矩阵C来实现矩阵乘法。
  • 总结了不同存储格式下如何使用cuBLAS API进行矩阵乘法的关系表。
  • 提供了不同情况下的参数设置和矩阵存储格式的对应关系。
➡️

继续阅读