转录组分析----数据下载

From 生信技能树 的娟老师

1、从数据库中下载之后通过xftp传递到服务器上。(传递到当前目录,利用pwd命令看当前路径,之后复制到ftp)
$ ll
total 20
drwxrwxr-x 2 Apr7 Apr7 4096 Apr 27 21:58 ./
drwxrwxr-x 3 Apr7 Apr7 4096 Apr 27 21:54 ../
-rw-rw-r-- 1 Apr7 Apr7 8712 Apr 27 21:58 filereport_read_run_PRJNA229998_tsv.txt
2、我们利用asp软件下载,得到asp的下载链接,找到fastq_aspera 所在的列。即第10列。
(rna) Apr7 21:58:52 ~/project/Human-16-Asthma-Trans/data/rawdata
$ head -n 1 filereport_read_run_PRJNA229998_tsv.txt  #显示表格的第一行,即表头
study_accession sample_accession    experiment_accession    run_accession   tax_id  scientific_name base_count  fastq_md5   fastq_ftp   fastq_aspera    submitted_ftp   sra_md5 sra_ftp sra_aspera  sample_title
(rna) Apr7 21:59:22 ~/project/Human-16-Asthma-Trans/data/rawdata
$ head -n 1 filereport_read_run_PRJNA229998_tsv.txt | tr '\t' '\n' #把tab分隔符号换成行
study_accession
sample_accession
experiment_accession
run_accession
tax_id
scientific_name
base_count
fastq_md5
fastq_ftp
fastq_aspera
submitted_ftp
sra_md5
sra_ftp
sra_aspera
sample_title
(rna) Apr7 22:06:44 ~/project/Human-16-Asthma-Trans/data/rawdata
$ head -n 1 filereport_read_run_PRJNA229998_tsv.txt | tr '\t' '\n'|cat -n  #cat给每一行编号
     1  study_accession
     2  sample_accession
     3  experiment_accession
     4  run_accession
     5  tax_id
     6  scientific_name
     7  base_count
     8  fastq_md5
     9  fastq_ftp
    10  fastq_aspera
    11  submitted_ftp
    12  sra_md5
    13  sra_ftp
    14  sra_aspera
    15  sample_title
(rna) Apr7 22:06:44 ~/project/Human-16-Asthma-Trans/data/rawdata
$ less -S filereport_read_run_PRJNA229998_tsv.txt |cut -f 10 |less -S #看这个表格cut的第10行之后再看
image-20210427222038012.png
image-20210427222330367.png
如何弄成一行只有一个完整的下载链接呢?
less -S filereport_read_run_PRJNA229998_tsv.txt |awk -F'\t' 'NR>1 {print}' |less -S  #awk 输出第一行,默认分隔符为空格,所以我们指定的分隔符tab键,-F'\t',然后我们发现一行具有多个链接。文件与文件的关系是以分号连接。
less -S filereport_read_run_PRJNA229998_tsv.txt |awk -F'\t' 'NR>1 {print$10}' |less -S |tr ';' '\n' |less -S #取第十行,然后利用tr将;换成换行。
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/008/SRR1039508/SRR1039508_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/009/SRR1039509/SRR1039509_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/009/SRR1039509/SRR1039509_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/000/SRR1039510/SRR1039510_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/000/SRR1039510/SRR1039510_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/001/SRR1039511/SRR1039511_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/001/SRR1039511/SRR1039511_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/002/SRR1039512/SRR1039512_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/002/SRR1039512/SRR1039512_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/003/SRR1039513/SRR1039513.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/003/SRR1039513/SRR1039513_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/003/SRR1039513/SRR1039513_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/004/SRR1039514/SRR1039514_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/004/SRR1039514/SRR1039514_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/005/SRR1039515/SRR1039515.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/005/SRR1039515/SRR1039515_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/005/SRR1039515/SRR1039515_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/006/SRR1039516/SRR1039516.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/006/SRR1039516/SRR1039516_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/006/SRR1039516/SRR1039516_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/007/SRR1039517/SRR1039517_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/007/SRR1039517/SRR1039517_2.fastq.gz
3、需要修改数据。用grep抓取
$ less -S filereport_read_run_PRJNA229998_tsv.txt |awk -F'\t' 'NR>1 {print$10}' |less -S |tr ';' '\n' |grep '_' >fq.url #grep抓取_的数据重新导入(>定向)至fq.url

查看当前目录

$ ll
total 28
drwxrwxr-x 2 Apr7 Apr7 4096 Apr 27 22:55 ./
drwxrwxr-x 3 Apr7 Apr7 4096 Apr 27 21:54 ../
-rw-rw-r-- 1 Apr7 Apr7 8712 Apr 27 21:58 filereport_read_run_PRJNA229998_tsv.txt
-rw-rw-r-- 1 Apr7 Apr7 2400 Apr 27 22:55 fq.url #
-rw-r--r-- 1 Apr7 Apr7 2924 Apr 27 22:12 s -S filereport_read_run_PRJNA229998_tsv.txt
4、只下载三个数据
$ head -n 6 fq.url >tem.url
$ cat tem.url  
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/008/SRR1039508/SRR1039508_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/008/SRR1039508/SRR1039508_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/009/SRR1039509/SRR1039509_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/009/SRR1039509/SRR1039509_2.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/000/SRR1039510/SRR1039510_1.fastq.gz
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/000/SRR1039510/SRR1039510_2.fastq.gz
5、下载链接

id 表示我们的下载链接

echo打印当前命令。循环命令。do done 代表命令的开始,每一次循环。 -i是密钥 ./ 下载到当前目录。

cat  fq.url |while read id
do
    echo "ascp -k 1 -QT -l 300m -P33001 -i ~/miniconda3/envs/rna/etc/asperaweb_id_dsa.openssh era-fasp@${id} ./ "
done
#下载命令,输入之后等待。
cat  fq.url |while read id
do
    ascp -k 1 -QT -l 300m -P33001 -i ~/miniconda3/envs/rna/etc/asperaweb_id_dsa.openssh era-fasp@${id} ./ 
done
6、下载完成
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343