这阵子开始做比较基因组的项目,由于没有root而且也不想折腾orthomcl,所以首选orthofinder,故而先是安装,这次使用conda安装
#环境是python2.7
conda create -n orthofinder python=2.7
#激活环境
conda activate orthofinder
#安装软件
conda install -c bioconda orthofinder
安装完成之后,本来打算用raxml进行建树操作的,但一旦软件进行check的时候,就会发现raxml没有安装,但你检查一下raxml确实是已经安装好了的,这时你进去orthofinder的配置文件,就会发现原来默认用的是raxmlHPC-AVX,而你检查的时候只有raxmlHPC-AVX2,所以需要进去修改一下
#修改配置文件
vim ~/miniconda3/envs/orthofinder/bin/config.json #注意是进入虚拟环境里面的bin改
而后就可以选择跑程序的选择了
orthofinder -f pep \ #存放蛋白数据的文件夹
-S blast \#比对模式,追求速度可以选择diamond
-M mas \#基因树推断方法
-T raxml \#建树软件
-t 10 \#线程,这里要注意一下,orthofinder一个主线程还会伴随2个子线程,所以当你的服务器线程被限制为48时,请注意要远低于线程选择16,这样你还可以检查一下,并且干其他事
然后就是等,结果一等就是5天,我以为跑完了,结果就这样报错了
Running OrthoFinder algorithm
-----------------------------
2020-06-08 17:08:45 : Initial processing of each species
OMP: Error #34: System unable to allocate necessary resources for OMP thread:
OMP: System error #11: Resource temporarily unavailable
OMP: Hint Try decreasing the value of OMP_NUM_THREADS.
ERROR: An error occurred, please review error messages for more information.
百度查了一下原因,原来是使用shell时候,默认环境里是直接服务器多少线程就多少线程,即使你被限制了,软件还是默认你有那么多线程,如果达不到就会报错,故而我们需要在软件中限制一下运行环境中的线程数,提前给软件一个提示,我这里就只有这么多线程,你不能超过这个数,然后软件检查的时候,已经被你提前通知了就不会报错了,具体修改方法如下:
#先找到orthofinder的位置
which orthofinder
#根据找到的位置,我们用vim编辑器打开
vim ~/miniconda3/envs/orthofinder/bin/orthofinder
#在orthofinder的脚本里面写入限制线程的代码,由于这个包原本就引入了os,故而我们直接写就好了
os.environ["MKL_NUM_THREADS"] = "12"
os.environ["NUMEXPR_NUM_THREADS"] = "12"
os.environ["OMP_NUM_THREADS"] = "12"
再次运行就不会报错了。
同时如果服务器被限制到线程,在运行一些java软件的时候也会出现GCthreads报错,这个真的就是看用的软件的运气了,如果软件写得好,那可以通过下面这样来限制环境的线程数
#在shell里面输入你想要限制的线程数
export _JAVA_OPTIONS="-XX:ParallelGCThreads=24"
#或者在java命令行里面加入
-XX:ParallelGCThreads=24
正常就可以运行了,但是类似tassel这个坑爹软件的话,会提示
Picked up _JAVA_OPTIONS: -XX:ParallelGCThreads=10
Error occurred during initialization of VM
java.lang.OutOfMemoryError: unable to create new native thread
如果你不做限制,或者限制接近你被限制的线程总数,则会提示这样的报错
# There is insufficient memory for the Java Runtime Environment to continue.
# Cannot create GC thread. Out of system resources.
# An error report file with more information is saved as:
具体接近看我后面怎么试了,幸好还有其他服务器可以用,转移一下数据就行,但也是够烦的,祝大家都买得起自己的塔式服务器,当自己的管理员,不用被限制到