182 conda activate chipseq
183 history | grep prefetch
184 which prefetch
185 prefetch -h
186 mkdir chipseq
187 cd chipseq/
188 mkdir {sra,raw,clean,align,peaks,motif,qc}
189 vim
190 vim acc.txt
191 cat acc.txt
192 prefetch --option-file acc.txt
193 nohup prefetch --option-file acc.txt -O ./sra &
194 cd sra
195 ls
196 cd ..
197 cat nohup.out
198 cd sra
199 ls
200 lsls
201 ls
202 cat nohup.out
203 cat ../nohup.out
204 history
205 history | grep prefetch
206 ls
207 cd ../
208 ls
209 cat nohup.out
210 cat acc.txt
211 prefetch SRR391032 -O ./sra
212 cd ../../
ps-ef 命令:
一、基础概念
指令: ps
作用: 主要是查看服务器的进程信息
选项含义:
-e:等价于 ‘-A’ ,表示列出全部的进程
-f:显示全部的列(显示全字段)
二、执行结果
列的含义说明:
UID: 该进程执行的用户id
PID: 进程id
PPID: 该进程的父级进程id,如果一个程序的父级进程找不到,该程序的进程被称为僵尸进程
C: cpu的占用率,形式是百分数(%)
STIME: 进程的启动时间
TTY: 终端设备,发起该进程的设备识别符号,如果显示‘ ?’表示该进程并不是由终端发起
TIME: 进程的执行时间
CMD: 该进程的名称或对应的路径
三、常用组合命令
命令:ps -ef | grep 进程名称
注意:执行该命令至少有一个进程(搜索该命令的进程)
例如:查看火狐浏览器的进程
其实是因为网络的问题一直下载不了数据,你可以自己的电脑登陆下载了上传到服务器上,你可以自己的电脑登陆下载了上传到服务器上。
287 history
288 conda avtivate chipseq
289 conda activate chipseq
290 ls
291 cd chipseq/sra
292 ls
293 cd ..
294 ls
295 mv sra/* raw #把sra文件夹下所有的文件移动到raw文件夹下
296 cd raw
297 ls
298 fastqc -h
299 fastqc -o fastqc -t 20 *gz
300 mkdir fastqc
301 fastqc -o fastqc -t 20 *gz #raw下所有的gz 文件进行fastqc,输出到fastqc文件夹下,线程数为20
302 cd fastqc
303 ls
会在fastqc文件夹下生成fastqc.zip 和 html报告
304 cd ..
305 ls
306 trim_galore -h
307 trim_galore --help
308 trim_galore -q 20 -o ../clean SRR391033.fastq.gz
这个时候选择trim_galore软件进行过滤,过滤条件:测序得到的原始序列含有接头序列或低质量序列,为了保证信息分析的准确性, 需要对原始数据进行质量控制,得到高质量序列(即Clean Reads),原始序列质量控制的标准为:
①去除含接头的reads;
②过滤去除低质量值数据,确保数据质量;
③去除含有N(无法确定碱基信息)的比例大于5%的reads;
309 cd ../clean
310 ls
311 less SRR391033.fastq.gz_trimming_report.txt
312 history