OrthoVenn2
OrthoVenn2是一个网页版的基因家族聚类工具,它基于OrthoMCL。
选择要分析的物种,也可上传蛋白序列
-
分析结果
OrthoFinder
将多个物种的蛋白序列放入data 文件夹下. 蛋白序列文件名称为 物种简写.fasta 。OrthoFinder 会根据fasta 文件前缀汇总统计表格。
- 文件准备
你要比较的物种的蛋白序列
A.fasta
B.fasta
C.fasta
D.fasta - 运行orthofinder
orthofinder \
-f data \ # 数据目录
-S diamond \ # 比对方法
-M msa \ # 基因树推断方法
-T fasttree \ #建树软件
-t 20 # 线程数,根据服务器配置选择
-
结果分析
所有结果都存放在orthofinder目录下
Comparative_Genomics_Statistics #统计结果
Gene_Trees # 每个家族基因树
MultipleSequenceAlignments # 多序列比对结果 包含单拷贝基因
Orthooups # 主要结果目录
Orthogroup_Sequences # 每个家族序列文件
Single_Copy_Orthologue_Sequences # 单拷贝基因家族序列
Species_Tree # 物种树构建结果
Orthooups目录包含
thogroups.GeneCount.tsv # 基因数目
Orthogroups_SingleCopyOrthologues.txt # 单拷贝基因家族列表
Orthogroups.tsv # 聚类结果
Orthogroups.txt # 聚类结果
Orthogroups_UnassignedGenes.tsv # 未聚类基因
-
可视化
OrthoFinder 结果一般使用venn 图展示,可以使用在线软件绘制venn图。
整理数据格式
保留需要的物种所在的列, 上传至在线网站jvenn.
http://jvenn.toulouse.inra.fr/app/example.html