生物信息领域目前最为成熟最为流程化的应该就是NGS的分析流程了,最近我也想着搭建一个NGS流程,目前的基本思路如下:
1、确定NGS的分析流程
原始数据质控——reads比对——突变检出(snp,indel)——突变注释——兴趣位点筛选
2、根据对应流程选择合适的软件
第一次做,就选一些认知度比较高的软件
原始数据质控使用:fastp
reads比对使用:bwa
突变检出:gank
突变注释:annovar
兴趣位点筛选:自己写脚本,目前看起来,perl用的很多,奈何本人没文化,尝试python写写看
3、测试各个软件的参数
4、写流程脚本,将各个流程的命令串联起来
6、跑一个常规人的,NGS wes的demo
7、根据个人需求添加软件内容
预期:写一个可以被来者重复且有用的流程出来。