今天在跑smart-seq2数据的上游,突然发现有一个trim_galore处理过的文件命名不太一样,其他文件命名都类似‘SRR19781608_2_val_2.fq.gz’,但有个细胞的文件命名是‘SRR19781820_2_trimmed.fq.gz’。我返回看了历史日志,发现该细胞文件跑trim_galore时出现了报错
因为我不是很理解报错的原因,所以我重新下载了fq文件,跑了第二次,但结果还是报错。猜测可能是fq文件的问题。接着我从ENA上下载了sra文件,用fastq-dump转fq文件。得到fq文件后再跑trim_galore,代码如下:
#sra文件转换fq
nohup parallel-fastq-dump --sra-id SRR19781820 --threads 1 --outdir ./ --split-files --gzip &
#trim_galore
dir=/home/data/t150448/scrna/sc_RGC_PRJNA851588/PRJNA851590/2.fastq/trim_galoreData/
nohup trim_galore -q 25 --phred33 --stringency 3 --length 36 --paired SRR19781820_1.fastq.gz SRR19781820_2.fastq.gz -o $dir >trim_galore-log.txt &
报错消失。