目前只能在冬神的电脑上面跑,而且还需要下载nr数据库,非常非常麻烦。
我需要想一个办法把数据库下载ok
PSSpred的数据预处理:首先将一个个文件分割成小文件进行处理
import sys
import os
f = open(sys.argv[1])
h = f.readlines()
length = len(h)
j=0
for i in range(length):
if h[i][0]=='>':
pro = h[i][1:-1]
j=j+1
if not os.path.exists('input/'+sys.argv[2]):
os.mkdir('input/'+sys.argv[2])
fw = open('input/'+sys.argv[2]+'/'+pro.replace("|","-")+'.fas','w')
fw.write(h[i])
else:
fw.write(h[i])
然后再写批处理文件进行批处理:
#!/bin/bash
start=`date +%s` #定义脚本运行的开始时间
for file in ~/huangle/fungi_annotation/fungi_data/*
do
{
python split.py $file ${file##*/}
echo 'success split '$file' !';
}&
done
wait
end=`date +%s`
echo "TIME:`expr $end - $start`"