写在前面
是的,最后,我选择了「一条路走到黑」~ 咱们先不管一些人如何看,东西先整出来。大体如下。
没错。从「原始测序数据」到「SNP Calling」,也就是 从 .fastq 到 .vcf,一套聚齐了。其中涉及到三个目前最常用的软件:
- bwa-mem2 -> 读段回帖
- samtools -> 重复标记排序
- bcftools -> 变异检测过滤
有了这三个插件,所有的「TBtools」用户,可以在 Windows 或者 MacOS 下,点点点,分析自己想分析的数据。当然,时间成本前面有提到,最好是按照至少一天跑一个样品来算。做做 BSAseq 或者少数两三个样品还是可以的。大的群体,那么就可能需要足够好配置的机器....这个暂时不是咱们要考虑的事情。
前两个插件都介绍过了。今天介绍「BCFtools GUI Wrapper」,整体如下。
一次包括两个功能,变异检测和变异过滤。
使用「TBtools」进行「SNP Calling」
从界面来看,比较简单。只需要将 MarkDup.PositionSorted.bam 都拖拽放置进去就可以了。
逻辑上需要等一些时间,可以得到初步的 bcf 文件。
使用「TBtools」进行「SNP Filtering」
「SNP Calling」之后,几乎所有情况下,都会做下一步过滤。具体过滤参数会对后续分析产生一定的影响。此处,默认给了一个相对严格的过滤参数,尽量保留「真阳性」SNP。具体使用方法如下。
简单来说...就是把文件放进去,然后设置一下输出目录,最后点击「Start」即可。
写在最后
基本完事。三个「玩具」,欢迎「试玩」。我觉得,BSAseq真的可以试试了。因为有了 VCF 之后,剩下的其实就是一个 R包 的事儿。这个就用 R-Plugin 了。而如果你的 PC 真的强,你甚至还可以用搞 GWAS,因为有了 VCF,剩下的不就是? R 包吗?