进入NCBI官网后选择GEO,输入GSE183976,进入数据下载页面。
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE183976
点击SRA Run Select选项,进入fastq数据下载页面。
进来后我们可以看到很多的样本和它们对应的原始数据。
由于数据太大,这里只下载第一个进行演示。下载的话我们可以用sra-tools中的 prefetch命令。
prefetch SRR15859344 &
如果需要一次需要下载多个数据的话可以下载
这个文件里面有所有的文件ID号
cat SRR_Acc_List.txt | while read id;do (prefetch ${id});done
也可以自己写个脚本进行下载。
或者我们也可以点击那个样本名后,进入下面的页面用wget直接进行下载
其实也可以用迅雷直接下载的,速度很快,我一般就直接在这里用迅雷下载……
二、数据转换:SRA文件转换为fastq文件
ls /public/project/RNA/sra/* |while read id; do (fastq-dump --gzip --split-3 -O ./ ${id} &); done
这样我们就下好数据并转换为fastq文件了,并用于下面的数据分析。
RNA-seq入门
RNA-seq入门(一)数据下载和格式转换