大规模个体 fMRI 数据集中脑编码的岭回归扩展
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
评估不同的并行化技术以减少脑编码的训练时间。使用Intel Math Kernel Library在单个机器上使用32个线程时比OpenBLAS库快1.9倍。使用Dask进行批处理并行化的Batch-MultiOutput回归在计算节点和线程上扩展得很好,在8个计算节点和32个线程相对于单线程的情况下加速了33倍。这种方法在高性能计算系统上使用scikit-learn和大型fMRI数据集进行脑编码具有可扩展性。
🎯
关键要点
-
评估不同的并行化技术以减少脑编码的训练时间。
-
Intel Math Kernel Library 在单个机器上使用 32 个线程时比 OpenBLAS 库快 1.9 倍。
-
使用 Dask 进行批处理并行化的 Batch-MultiOutput 回归在计算节点和线程上扩展得很好。
-
在 8 个计算节点和 32 个线程相对于单线程的情况下加速了 33 倍。
-
这种方法在高性能计算系统上使用 scikit-learn 和大型 fMRI 数据集进行脑编码具有可扩展性。
➡️