使用ZenDNN库在AMD EPYC™处理器上实现最佳推理性能

Posted by Sarina Sit, AMD AMD launched the 4th Generation of AMD EPYC™ processors in November of 2022. 4th Gen AMD EPYC processors include numerous hardware improvements over the prior...

2022年11月,AMD发布了第四代AMD EPYC™处理器,包括AVX-512和VNNI指令集扩展等硬件改进,以提高推理性能。同时,AMD还宣布了适用于TensorFlow v2.12及以上版本的新版TensorFlow-ZenDNN插件,通过框架上游化改进ZenDNN优化的可访问性。TF-ZenDNN是ZenDNN与TensorFlow的集成,通过修改TensorFlow代码实现。该插件提供了16个常见的ZenDNN操作,但不支持所有图形优化。使用ZenDNN优化在AMD EPYC处理器上的步骤简单明了。

原文英文,约1000词,阅读约需4分钟。发表于:
阅读原文