基本概念 代谢物:所有分子量小于1500Da的小分子物质,包括糖类、核苷、有机酸、酮类化合物、多肽、氨基酸、有机胺类、醛类化合物、脂质、萜类、类固醇、生物碱、小分子药物等等。...
简介 1. 物种丰富度指数(Species richness):群落中丰度大于0的物种数之和,一般用Observed OTU(observed species)表示,只有物种...
1. Chao1多样性指数[http://blog.sciencenet.cn/blog-2970729-1074963.html] chao1是度量物种丰富度的指标,它和丰...
【导读】多样性指数是一种量化指标,可反映数据集中有多少种不同类型,并且可以同时考虑到这些种类的个体分布之间的系统性关系,例如丰富性,差异性或均匀性。常用的多样性指数有辛普森多...
方案1: 不纠错直接组装。输入数据分为两种情况,一种是用所有的原始数据(包括长度过滤2K/5K以下),一种则是选择最长的30X, 40X作为输入。 miniasm: http...
linux下的find文件查找命令与grep文件内容查找命令 在使用linux时,经常需要进行文件查找。其中查找的命令主要有find和grep。两个命令是有区的。 区别:(1...
1.jellyfish 运行jellyfish 2.使用 GCE 进行基因组大小评估 GCE 软件包中主要包含 kmer_freq_hash 和 gce 两支程序。前者用于进...
同源预测(homology prediction)利用近缘物种已知基因进行序列比对,找到同源序列。然后在同源序列的基础上,根据基因信号如剪切信号、基因起始和终止密码子对基因结...
概况:使用处理后的fastq文件和基因组与转录组比对,确定在转录组或者基因组中的关系。在转录组和基因组的比对采取的方案不同。分别是ungapped alignment to ...
sed是一个很好的文件处理工具,本身是一个管道命令,主要是以行为单位进行处理,可以将数据行进行替换、删除、新增、选取等特定工作,下面先了解一下sed的用法 sed命令行格式为...
gbff是NCBI基因组数据库常见的基因组genebank格式文件,在实际分析中,常常需要gff格式或者gtf格式,所以就存在gbff转换gff格式的需求image.png ...
HISAT2,StringTie,Ballgown处理转录组数据思路如下: 数据质控 将RNA-seq的测序reads使用hisat2比对 samtools将sam文件转成b...