查询某一基因启动子区域的CpG岛,一般有两种方法:一种是查文献,看您关注的基因,别人做的CpG岛是哪些,这个对自己选择位点有指导作用;另一种是UCSC数据库中查找,这种方法可以直接将该基因启动子区域的CpG岛信息都获取下来。
我们建议两种方法结合起来,用UCSC查询出某基因启动子区域所有的CpG岛,参考别人的研究,最终确定自己想要研究的甲基化位点。
以EPB41L1为例,为大家展示一下获取基因启动子区域CpG岛信息的操作流程。
1. 打开UCSC(http://genome.ucsc.edu/),点击Human GRChg38/hg38,如下图:
2. 在空白框内输入“EPB41L1”,同时下拉箭头到 “regulation” 那一行,在下面 CpG Island的选择框中选择“show”,然后点击go;
**3. **接着,得到如下界面,在UCSC 上可以,看到EPB41L1这个基因内部和基因附近有4个CpG 岛,分别用红色框出来了。
EPB41L1在基因组中的坐标为:chr20:36091504-36232799
CpG 85 在基因组中的坐标为:chr20:36064533-36065578,其位于基因上游25926 bp 处;
CpG 178 在基因组中的坐标为:chr20:36092082-36093626,其位于基因起始处;
CpG 45 在基因组中的坐标为:chr20:36154402-36154787,其位于基因内部;
CpG 29 在基因组中的坐标为:chr20:36236366-36236700,位于基因下游6569 bp 处。
我们综合看一下这四个CpG岛:
CpG 85 虽然位于基因上游,但是距离基因较远,因此我们认为它不调控EPB41L1 这个基因的表达。
CpG 29虽然距离基因较近,但是它在基因下游,目前一般研究CpG 岛的多位于基因上游和基因内部。因此我们也认为他不调控基因的表达。
综合以上,分析部认为EPB41L1 值得研究的CpG岛有两个,CpG178和CpG45。这时可以查阅文献,看别人做的哪一个,作为自己选择的参考。
**4. **下面小编以CpG178为例,进一步看一下如何获取具体核酸序列,点击绿色的CpG178,
然后得到以下界面,再点击“View DNA for this feature”,
得到如下界面,选择Reverse complement,然后点击“get DNA”,
最后, CpG178的核酸序列如下: