MacOS 12.0以后的系统更改了blas的位置,具体去哪了现在不清楚,目前的办法是brew安装openblas,然后把openblas软连接过去
问题与思考
在写OneStepWGCNA插件的时候我就遇到过一个奇怪的现象,在Rstudio下计算TOM矩阵那一步很快,8000个基因基本是几十秒算完,但是一旦打包成插件,或者用Rscript跑脚本的时候,那一步会巨慢无比,8000个要等好几分钟。
当时也不知道怎么回事,就先放着,最近正在做WGCNA,想用插件跑跑,发现实在是太慢了!!!!然后就开始研究怎么回事,知道我看到terminal下卡主的步骤:
TOM calculation: adjacency..
..will not use multithreading.
Fraction of slow calculations: 0.000000
..connectivity..
..matrix multiplication (system BLAS)..
BLAS 之前在WGCNA-FAQ中好像看到过这么个名词,于是就回去查看了一下文件。果然,当时没搞懂的,现在一下明朗了:
1 How can I make network construction execute faster?
When constructing a network from a data set of a typical genomic size (i.e., between 10 000 and 30 000 genes or other variables), the most time consuming step is the calculation of Topological Overlap Matrix which involves multiplying matrices with tens of thousands of rows and columns. With a standard R distribution, this may take multiple hours even on a modern workstation since matrix multiplication in standard R does not take advantage of multi-threading (parallel execution). It is possible to speed up this process by a factor of 10-100 by installing a speed-optimized Basic Linear Algebra Subprograms (BLAS) library and compiling R against it. The process of compiling R against an enhanced BLAS library is described in the R installation and adminitration manual. Compiling R on Linux and Unix flavors is usually relatively simple and straightforward. On Mac OSX and (more so) on Windows it requires installing additional tools and packages. Although it is helpful to have administrator privileges to compile and install R, it is usually not necessary. See the R installation and adminitration manual for full details.
作者大致意思是如果你想提高R的矩阵运算能力,需要使用强化版的BLAS,R默认调用的是基础班的BLAS,强化版的要比基础版的快10-100倍。但是这玩意不好装,需要从源码编译,linux下简单,但是win和mac下就比较蛋疼了。
But! 我发现在win和mac下其实也没有那么难,虽然我也不懂什么BLAS,但是作为一个调包侠,最基础也是最重要的一个技能就是,善用各种搜索。不断的google下终于发下了mac和win下的解决方案,不需要编译,mac只需要敲两行命令,win复制几个文件就搞定了.
先发参考链接:
Faster matrix math in R on macOS
Windows使用OpenBLAS加速R语言计算速度
方法
MacOS big sur 11.2.1测试成功
其实就是苹果系统下,调用苹果自己的BLAS,具体:Apple’s implementation of the Basic Linear Algebra Subprograms (BLAS). 参考上面大胡子老哥的操作,就是把苹果自己的BLAS文库替换掉R默认的BLAS
## TBtools的R安装在Rserver下,所以TBtoolsR的lib位置如下,先进入这个路径
cd ~/.TBtools/.Plugin/Rserver/bin/macR/lib
## 将系统Apple的BLAS软连接过来
ln -sf /System/Library/Frameworks/Accelerate.framework/Frameworks/vecLib.framework/Versions/Current/libBLAS.dylib libRblas.dylib
如果这个操作过后发现你的Rserver挂了,用下面的命令恢复:
ln -sf libRblas.0.dylib libRblas.dylib
虽然你测试sessionInfo()
发现没有和帖子里说的一样出现下面提示,但是确实是快了!反正我的Nuc8是直接风扇起飞了....感觉至少快了30倍,当然随着基因数目的增多,这个倍数也会翻倍....
BLAS: /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib
Win10下测试成功
win10下用的是openBLAS,具体请看Github-openBLAS
原贴实在豆瓣看到的:让R在windows下开足马力进行计算 后来CSDN那个老哥都给下载整理好了,直接拿来用,刚开始担心版本问题,后来看来是想多了,直接把帖子中作者整理好的网盘里的文件替换掉:在操作之前先把x64文件夹下的文件备份一下
## 按顺序打开:
我的电脑 -> c盘 -> 用户 -> 你的用户名对应的文件夹 -> .TBtools -> .Plugin -> Rserver -> bin -> winR -> bin -> x64(32的对应打开32) -> 粘贴
然后就搞定了,再试试OneStepWGCNA吧,速度嗖嗖的!