1. 构建参考基因组的序列的index
bowtie-build reference.fasta reference
2. 将测序序列比对到参考基因组
这里的输入序列可以是seq.txt,qseq.txt,fasta,fastq格式,输入为解压格式。
perl mapper.pl \
input.fastq \ #输入为fastq文件
-e \ #指定输入为fastq格式
-h \ #解析出fasta格式
-j \ #删除非核酸字母(a,c,g,t,u,n,A,C,G,T,U,N)
-k TCGTATGCCGTCTTCTGCTTGT \ #3'端的接头序列
-l 18 \ #保留最小的长度
-m \ #collapses the reads
-p reference \ #bowtie index的参考序列
-s out_collapsed.fa \ #输出文件名
-t out.arf \ #输出比对文件
-u \ #保留中间文件
-n \ #覆盖已经生成的结果
-o 16 #运行的线程数
3. 鉴定已知和未知的miRNA
perl miRDeep2.pl \
out_collapsed.fa \ #是经过mapper.pl处理的reads。
reference.fasta \ #参考序列
out.arf \ #mapping的结果
ref_mature_miRNA \ #研究物种的成熟miRNA文件,miRBase有下载
none \ #其他物种相关的成熟miRNA文件,miRBase有下载
ref_hairpin_miRNA \ #研究物种miRNA前体的文件,miRBase有下载
-t hsa #物种