基于机器学习的现代多核系统上 BLAS Level 3 的运行时优化

📝

内容提要

BLAS 三级操作的多线程实现中,使用机器学习优化运行时,在现代多核系统上实现了 1.5 至 3.0 倍的加速,证明了 ADSALA 方法在优化 BLAS 例程上的有效性和普适性。

🏷️

标签

➡️

继续阅读