第一步:除掉 小于18bp 大于25bp 的序列 (参考其他文献,主要包括miRNA 和siRNA)
操作:conda 安装 cutadapt (啊啊啊啊,不知道问什么,我的conda这么不好用,耗了很久。。。)(链接:https://www.jianshu.com/p/4ee2f4d2292f)
reads的过滤
--minimum-length LENGTHor-m LENGTH#根据最短长度筛选reads;
--too-short-output FILE#为reads长度最小值设定阈值筛选reads后,要丢弃的部分输出到文件;
--maximum-length LENGTHor-M LENGTH#根据最长长度筛选reads;
--too-long-output FILE#为reads长度最大值设定阈值筛选reads后,要丢弃的部分输出到文件;
--untrimmed-output FILE#将没有adapter未做修剪的reads输出到一个文件,而不是输出到trimmed reads结果文件
--discard-trimmed#丢弃只有一个adapter的reads
--discard-trimmed等价于 --untrimmed-output /dev/null #丢弃没有adapter的reads
作者:_eason_
链接:https://www.jianshu.com/p/4ee2f4d2292f
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
我的代码 :/baicai2/weiyx/....../cutadapt -m 18 -M 25 --too-short-output short.file --too-long-output long.file -o output.fa input.fa
#!/usr/bin/bash
for i in `cat name.txt`
do /baicai2/weiyx/anaconda2/bin/cutadapt -m 18 -M 25 --too-short-output $i.short --too-long-output $i.long -o $i.fa $i\_clean.fa
done