来源:https://genechem.biomart.cn/news/2903754.htm
启动子查找和转录因子预测真的不简单?那还不赶快收藏这份干货!
启动子作为基因表达的“开关”,行使控制基因表达时间及强度的职能,是结构基因的重要组成部分。而且启动子的控制功能多由转录因子调控。因此,转录因子—启动子结合研究显得尤为重要。
但是如何获取一个基因的启动子和预测并验证转录因子与其的结合呢?
本文将从启动子的查找到转录因子的预测全方位解决您的问题。
启动子是位于结构基因5'端上游的DNA序列,能活化RNA聚合酶,使之与模板DNA准确结合并具有转录起始的特异性,常规启动子以二型为主,核心序列包含TATA box和CAAT box,这两部分组成的序列含有基础转录活性,也就是具备启动子特征,但是表达水平很低,此序列紧挨着转录起始位点TSS,一般位于编码基因5UTR(不是ATG哦)上游的300bp之内。
核心启动子结构
研究启动子,不是研究核心启动子,而是研究启动子在细胞不同状态下表达活性的差异性,这种差异由启动子临近基序调控,研究较多的是增强子、甲基化、转录因子,这些基序位于核心启动子上游居多,所以,常规取包含核心启动子及其上游共计2kb进行研究。
转录因子-启动子结合图
具体如何操作呢?
一、启动子获取
打开NCBI主页GENE链接,在搜索框输入对应基因及物种:
打开搜索的结果,进入基因界面。
注意点一
注意基因位于染色体正义链还是反义链—看箭头指向,如果是正义链,则启动子取Location左侧数字减去2000bp;如果是反义链(染色体写法会加上complement),则取Location右侧数字加2000bp。
注意点二
根据转录本确定启动子实际所在位置。很多科研工作者认为基因组延伸的序列就是启动子,或者一个基因只有一个启动子,实际上这是错误的。基因通过RNA剪切机制,从RNA中选择外显子的不同部分以形成不同的mRNA序列,每个独特的mRNA序列产生独特的蛋白质,这些高度相似的蛋白质亚型可以由可变剪切、可变启动子或单基因的其他转录后修饰形成。
可变剪切产生不同的转录本和蛋白质
所以,研究基因得确定候选的转录本亚型,转录本亚型可从上述基因界面获得,该界面对不同亚型会有具体分类(如isoform 1,isoform a等),亚型不同,启动子可能会有差异,可在Genomic regions, transcripts, and products处查看:
点击“Genbank”:
调整后点击“Update View”:
再以Genbank格式导出序列,命名为“ABCB1基因组”。用snapgene软件打开此序列:
用snapgene软件打开对应的NM转录本(import导出),复制第一个外显子在基因组序列搜索,其上序列就是启动子座落区,复制出来即可。
二、转录因子预测
1. Jaspar预测
打开Jaspar网站,在搜索框里输入转录因子名称,“搜索”,按照下图选择转录因子以及填入序列:
物种:若无对应项,可选择近缘物种,因为转录因子在物种间保守性较高;
阈值:为转录因子结合序列与启动子匹配度算法,默认为80%,调整大小放宽或者收紧预测结合数量;
core:为预测评分,越大越好,大部分转录因子在80%的阈值为5分上下,可以参考该值,大于5分算比较好的结合;反之较差;
Strand:表示转录因子在启动子的正义链(+)、反义链(-)结合;无论正负都是有意义的。
2. hTFtarget预测
打开hTFtarget网站,点击“Predict”,输入序列、选择对应转录因子,点击“预测”:
得到的结果跟jaspar类似,score越大越好。
3. consensus sequence匹配
不同转录因子数据库收录的数据是不一样的,若jaspar等数据库未收录特定转录因子,可查询转录因子结合的共有序列进行匹配,如motifmap、uniprobe、蛋白数据库等,以consensus sequence直接匹配即可。
如motifmap查询到stat3的consensus,直接复制该序列,在打开启动子的snapgene软件里面control F搜索,寻找有无匹配项。
三、验证篇
1. 荧光素酶实验之截断
截断验证:逐步缺失远端序列(因为核心启动子位于靠近TSS端,缺失该处会丧失基本转录活性);
适用:预测结合位点较多,且评分相近,需要进一步缩小范围。
2. 荧光素酶实验之突变
结合位点单点突变:将感兴趣的点逐步突变以验证具体结合位点;
适用:评分相对较高或者唯一的位点、或者由其他实验途径缩小范围的点;
突变方法:将结合序列突变为与consensus sequence相对序列或者缺失,再预测复核一下即可
3. 免疫方法
Chip、EMSA等免疫学手段研究转录因子与DNA的具体区段锁定结合位点。
适用:结合位点较多,研究片段较长,结合位点远离启动子等情况
看到这里,从启动子的选择,到转录因子的预测,再到最后的实验验证是不是都get到了呢。
能进行启动子查找的网站和转录因子预测方法有很多,结果也会存在差异,最终只有通过实验验证的才是最准确的。