NOVOPlasty 是一个perl脚本,没有依赖任何其他软件,下载好以后直接可以使用。下载链接https://github.com/ndierckx/NOVOPlasty ...
NOVOPlasty 是一个perl脚本,没有依赖任何其他软件,下载好以后直接可以使用。下载链接https://github.com/ndierckx/NOVOPlasty ...
#1 安装Aspera 下载地址:https://downloads.asperasoft.com/connect2/NCBI首页也有提供下载: 到了下面这个页面,一步一步操...
http://kobas.cbi.pku.edu.cn/kobas3KOBAS是一种广泛使用的基因富集(GSE)分析工具。它的版本1.0和2.0分别于2005年和2011年发...
准备训练集和测试集 根据Augutus的官方教程,可靠的基因结构序列的要求如下: 提供基因的编码部分,包含上游几KB。通常而言,基因越多,效果越好,至少准备200个基因以上。...
根据已有的蛋白库,对从基因组上提取到的蛋白序列进行比对,从而获得相应的信息。 常用的数据库: Nr:NCBI官方非冗余蛋白数据库,包括PDB, Swiss-Prot, PIR...
MAKER配置文件详解 本文翻译自http://weatherby.genetics.utah.edu/MAKER/wiki/index.php/The_MAKER_cont...
GeneMarkGeorgia Institute of Technology开发的一系列基因预测工具。真核生物基因组预测主要会用到GeneMark-ES/ET, 其中Gen...
作者:史提芬先森原文:https://www.yuque.com/shenweiyan/cookbook/how-to-install-perl-modules[https:...
训练 ab initio 基因预测工具(以SNAP为例) 对于一个新的物种而言,你大概率是没有一个高质量的基因模型去进行基因预测。但是我们可以利用EST序列(少部分物种估计有...
准备阶段 训练SNAP模型,需要准备三个文件,分别是参考基因组序列,组装的转录本序列和同源蛋白序列。 对于参考基因组序列,我们要保证N50需要超过预期基因长度的中位数,否则注...
在基因组注释上,MAKER算是一个很强大的分析流程。能够识别重复序列,将EST和蛋白序列比对到基因组,进行从头预测,并在最后整合这三个结果保证结果的可靠性。此外,MAKER还...
首先下载juicer后,另建一个juicer-work的文件夹,juicer-work里面各个文件夹的位置要放对,reference, fastq等,注意script里放上C...
使用二代数据或三代数据得到contig后,下一步就是将contig提升到染色体水平。对于二倍体物种而言,目前3D-DNA应该是组装效果最好的一个软件。 一:工作流程 使用3D...
虽然高通量测序分析最常用的操作是将fastq比对到参考基因组得到BAM文件,但偶尔我们也需要提取BAM文件中特定区域中fastq。最开始我认为这是一个非常简单的操作,因为sa...
下面这个报错信息较常见,但是如果每一条bam记录都是这样,就不常见了,我这两天遇到了这种情况。先看看正常情况下是如何报错的: WARNING: Query SRR328680...
在一年前,我写过一篇文章,叫做如何从BAM文件中提取fastq,之前也发现了从BAM里面提取Fastq是有些麻烦,只不过最后通过samtools的子命令实现了数据提取,实现功...
作者:ahworld链接:Hi-C数据质控原理来源:微信公众号-seqyuan著作权归作者所有,任何形式的转载都请联系作者。 Hi-C数据质控原理-视频 Hi-C文库的插入片...