基于机器学习的现代多核系统上 BLAS Level 3 的运行时优化
📝
内容提要
BLAS 三级操作的多线程实现中,使用机器学习优化运行时,在现代多核系统上实现了 1.5 至 3.0 倍的加速,证明了 ADSALA 方法在优化 BLAS 例程上的有效性和普适性。
🏷️
标签
➡️
BLAS 三级操作的多线程实现中,使用机器学习优化运行时,在现代多核系统上实现了 1.5 至 3.0 倍的加速,证明了 ADSALA 方法在优化 BLAS 例程上的有效性和普适性。