cuBLAS GEMM API在列主序和行主序矩阵中的使用
💡
原文英文,约800词,阅读约需3分钟。
📝
内容提要
cuBLAS GEMM API对输入输出矩阵的存储格式有严格要求。若矩阵为列主序格式,可直接使用;若为行主序格式,设置参数时易出错。本文讨论了矩阵转置与列主序存储的关系,以及在不同情况下如何使用cuBLAS GEMM API。
🎯
关键要点
- cuBLAS GEMM API对输入输出矩阵的存储格式有严格要求。
- 列主序格式的矩阵可以直接使用,行主序格式的矩阵在设置参数时容易出错。
- 本文讨论了矩阵转置与列主序存储的关系。
- cuBLAS单精度GEMM API的声明格式和功能介绍。
- 如果矩阵以行主序格式存储,必须进行转置才能使用cuBLAS进行矩阵乘法。
- 在某些情况下,可以通过转置矩阵C来实现矩阵乘法。
- 总结了不同存储格式下如何使用cuBLAS API进行矩阵乘法的关系表。
- 提供了不同情况下的参数设置和矩阵存储格式的对应关系。
➡️