SnpEff:vcf注释软件安装及应用

需要准备的内容:

  • 环境:Linux 或 Ubuntu,已经安装openjdk
  • 文件:通过 GATK 流程得到的变异或者 VCF 格式的文件
  • 参考文件:对应基因组版本的 gff 或 gtf 注释文件、参考基因文件
  • 软件:SnpEff,更多说明查看请 点击链接帮助文档
  • 以 Ecoli 为例: NCBI的FTP地址

参考基因组相关文件下载:

  • 参考基因组:通过 wget 下载 FTP目录下 的后缀为 genome.fna.gz 基因组文件
  • 参考基因组对应注释文件:通过 wget 下载后缀为 genome.gff 的注释文件,gft 也可

SnpEff 安装

  • conda 安装(不推荐)

    conda 安装不利于自定义参考基因组及注释文件
conda indstall snpeff -y
  • 安装包下载直接使用(推荐)

cd work_dir/  #进入工作目录

#下载方式一
wget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip
#解压
unzip snpEff_latest_core.zip

#下载方式二
git clone https://github.com/pcingola/SnpSift.gi

注释数据库准备:

  • 自动下载

    不推荐,下载时间过长
java -jar snpEff.jar databases | grep -i GRCh |  awk '{print $1}' #查看数据库中是否存在对应物种
java -jar snpEff.jar download {name_in_snpEffdatabase} #可通过搜索到的物种名下载数据
  • 手动准备

此处要特别注意参考文件所在文件夹文件命名

#建立文件夹
cd snpEff  #进入 snpEff 目录下
mkdir data  #新建 data 目录
cd data  #进入 data 目录下,必须在该目录
mkdir genomes  #新建 genomes 目录,用于建立 ecoli 目录中的 bin
mkdir ecoli  #新建 ecoli 目录,对应物种名或后续软件调用的参数名

#将参考基因序列放至 genomes 目录下并改名,改名对应 data 中的 ecoli 文件夹名
gzip -d {reference}_genomic.fna.gz
mv dir_path/{reference}_genomic.fna snpEff/data/ecoli.fa

#将参考注释放至 ecoli 文件夹中并一定改名为 gene.gff
gzip -d {reference}_genomic.gff.gz
mv dir_path/{reference}_genomic.gff snpEff/data/genes.gff

#配置 snpEff/snpEff.config 文件
echo "ecoli.genome:ecoli" >> snpEff.conf
#可配置 config 文件自定义 data 文件夹路径
#data_dir = PATH/TO/data/

#软件配置自动建立数据库,建立后文件夹 ecoli 中生成 snpEffectPredictor.bin 文件
java -jar snpEff/snpEff.jar build -gff3 ecoli
#-gff3 对应为 ecoli 文件夹中注释文件的对应格式版本
#如果注释文件的格式版本在后缀名中无法体现,可通过 head 命令查看文件头信息获得
#head ecoli.gff
#ecoli 对应为 data 目录中的 ecoli 文件夹以及 genomes 目录中的 ecoli.fa 文件

#配置完成后的目录结构,其他文件夹/结构不显示
snpEff
├── SnpSift.jar
├── data
│   ├── ecoli
│   │   ├── genes.gff
│   │   └── snpEffectPredictor.bin
│   ├── genomes
│   │   └── ecoli.fa
├── examples/
├── galaxy/
├── scripts/
├── snpEff.config
└── snpEff.jar

SnpEff 的使用及注释

#详细见帮助文档
#举例
java -jar snpEff/snpEff.jar -v ecoli Ecoli.vcf.gz > Ecoli.anno.vcf.gz
#-v 表示显示更多信息
#ecoli 表示调用 data/ecoli/中的注释信息 

#结束后生成文件
├── EcoliK12.anno.vcf.gz
├── snpEff_genes.txt
├── snpEff_summary.html

Summary结果展示

image
image
image
image
image
image
image
image
image
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335

推荐阅读更多精彩内容