本文讨论了在GPU上执行卷积的方法以及NHWC和NC/xHWx布局的优势。NHWC布局在卷积操作中性能更快,而NC/xHWx布局适用于NVIDIA Tensor Core操作。卷积操作涉及输入激活张量、滤波器张量、可选偏置张量和输出激活张量。隐式GEMM方法在GPU上执行卷积,NHWC布局适合隐式GEMM卷积,但使用Tensor Core时需要填充。NC/xHWx布局可以立即与Tensor Core一起使用。
完成下面两步后,将自动完成登录并继续当前操作。