2024年对stdlib至关重要,社区新增84名贡献者,推动4000多次提交和500多个新包发布。Google夏季编程项目在REPL和BLAS支持方面取得重要进展。未来计划包括扩展数学库、改善REPL交互性及探索WebGPU,增强科学计算的网络可及性。
在未开启优化标志时,np.einsum的速度明显慢于np.matmul,尤其在矩阵乘法中。开启优化后,np.einsum的速度显著提升,接近np.matmul,原因是优化时调用了tensordot,利用了BLAS加速。
BLAS 三级操作的多线程实现中,使用机器学习优化运行时,在现代多核系统上实现了 1.5 至 3.0 倍的加速,证明了 ADSALA 方法在优化 BLAS 例程上的有效性和普适性。
本文介绍了编写算法的基础工具和PostgreSQL插件,依赖BLAS、LAPACK和GGML库。作者在MacOS上使用Homebrew安装开发工具和组件库,使用Clion作为主要编程工具,并介绍了GGML库的安装过程。
完成下面两步后,将自动完成登录并继续当前操作。