转录因子研究套路
1.基因的结构
1)编码区 Coding region
基因在结构上,分为编码区和非编码区两部分。真核生物的编码区是不连续的,分为外显子和内含子,在转录过程中会修剪内含子,并拼合外显子来形成转录产物。在原核生物中,基因是连续的,也就是说无外显子和内含子之分。
外显子 Exon:是在 preRNA 经过剪切或修饰后,被保留的DNA部分,并最终出现在成熟RNA的基因序列中。
内含子 Intron:在真核生物中,内含子作为阻断基因的线性表达的一段DNA序列,是在 preRNA 经过剪切或修饰后,被切除的DNA序列;去除内含子拼接外显子组成成熟的DNA
2)非编码区 Non-coding region
非编码区在对基因的表达调控中发挥重要作用,如启动子,增强子,终止子等都位于该区域,在人类基因中非编码区的占比超过90%。它们中的一部分可以转录为功能性RNA,比如tRNA(transfer RNA), rRNA(ribosomal RNA)等;可以作为DNA复制,转录起始来对复制,转录和翻译起到调控作用;也可能是着丝粒与端粒的重要组成部分。
- 启动子 (promoter)----能促进转录过程:启动子一般位于基因的转录起始位点,5‘端上游,在转录过程中,RNA聚合酶与转录因子可以识别并特异性结合到启动子特有的DNA序列。启动子本身并不转录而且也不控制基因活动,而是通过转录因子结合来调控转录过程。
(1)TATA框:其一致顺序为TATAATAAT。它约在基因转录起始点上游约-30-50bp处,基本上由A-T碱基对组成,是决定基因转录始的选择,为RNA聚合酶的结合处之一。
(2)CAAT框(有时也缩写为CAAT box或CAT box):其一致顺序为GGGTCAATCT,是真核生物基因常有的调节区
(3)GC框:有两个拷贝,位于CAAT框的两侧,由GGCGGG组成,是一个转录调节区,有激活转录的功能。
此外,RNA聚合酶Ⅲ负责转录tRNA的DNA和5SrDNA,其启动子位于转录的DNA顺序中,称为下游启动子。
2.增强子(enhancer)------增强转录的作用
增强子有别于启动子的地方:1) 增强子对于启动子的位置不固定,而能有很大的变动;它能在两个方向产生相互作用 2)一个增强子并不限于促进某一特殊启动子的转录,它能刺激在它附近的任一启动子。
3.终止子 Terminator:终止子处于基因或操纵子的末端,给RNA聚合酶提供转录终止信号的DNA序列。
终止子与终止密码子的概念区分:二者在名称上相似,但是含义是截然不同的。终止子是处于基因的非编码区的一段DNA序列,用于终止转录。而终止密码子是在翻译过程中终止肽链合成的mRNA中的三联体碱基序列,一般情况下为UAA,UAG和UGA,不编码为氨基酸。
- ATAAA
ATAAA 是 preRNA 在通过修剪后形成成熟mRNA 时在3'UTR产生ployA 是的加尾信号。但是这段序列并不是绝对保守,也可能为其他A富集的序列,比如AATAAA等。 - 回文序列 palindrome sequence
回文序列是双链DNA中的一段倒置重复序列,这段序列有个特点,它的碱基序列与其互补链之间正读和反读都相同。当该序列的双链被打开后,如果这段序列较短,有可能是限制性内切酶的识别序列,如果比较长,有可能形成发卡结构,这种结构的形成有助于DNA与特异性DNA与蛋白质的结合。
eg.5' GGTACC 3'
3' CCATGG 5'
2.preRNA
为转录起始位点 Transcription start sites (TSS): 是指与新生RNA链第一个核苷酸相对应的DNA链上的碱基,通常为一个嘌呤(A 或G),即5’UTR的上游第一个碱基。
5’末端的序列称为上游,而把其后面即3‘末端的序列称为下游.
-
转录终止位点 Transcription termination sites (TTS)
转录起始位点是指新生RNA链最后一个核苷酸相对应的DNA链上的碱基。当RNA链延伸到转录终止位点时,RNA聚合酶不再形成新的磷酸二酯键,RNA-DNA杂合物分离,转录泡瓦解,DNA恢复成双链状态,而RNA聚合酶和RNA链都被从模板上释放出来。 -
开放阅读框 Open reading frame(ORF)
ORF 是连续的一段密码子,其含有起始密码子(通常是AUG)和终止密码子(通常是UAA,UAG或UGA)。在真核基因中,ORF跨越内含子/外显子区域,其可以在 ORF 转录后拼接在一起以产生蛋白质翻译的最终mRNA。 由于读写位置不同(对应不同的起始位点),ORF 可能翻译为不同的多肽链。 上游即是5‘端的侧翼序列,下游则是3’端的侧翼序列。
3.RNA
5'UTR 与 3'UTR:这里需要注意的是外显子包含UTR区,也就是说外显子不只有可编码的序列,而且包含非编码序
UTR (Untranslated Region ),如果这段序列位于5'端,就称作5'UTR(5‘-untranslated region),也叫前导序列(leader)。相反若位于3'端,我们就叫它3'UTR(3‘-untranslated region),也叫尾随序列(trailer)。1978年,人类γ球蛋白mRNA的5′非翻译区被成功完全测序 。1980年,又开启了人类α-珠蛋白基因中3′非翻译区的研究。有趣的是,虽然叫非编码区,但是5′非翻译区内的上游可读框却可以被翻译成多肽1 。
5'UTR 位于从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至起始密码子AUG,3'UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的前端
- 5‘Cap:也被称为7-甲基鸟苷酸帽,缩写为m7G。这种结构在RNA进出细胞核起到识别作用;可以抗5'-核酸外切酶的剪切,增加稳定性;促进5’端内含子的切除;在翻译过程中有助于核糖体对mRNA的识别和结合。
- 3’ PolyA tail:Poly A tail 由多个腺苷一磷酸组成 ,也就是它是一段仅含有腺嘌呤碱基的RNA 。这种结构可以避免细胞质中的酶促降解,并有助于转录终止,mRNA从细胞核中的输出和翻译。
- CDS (coding dna sequence):CDS 是基因中DNA或RNA为蛋白质编码区域,该区域通常开始于5‘末端的起始密码子并结束于3’端的终止密码子。生物体基因组编码区的总和称为外显子组。
套路课:转录因子研究套路
转录因子结合靶基因
由于还做了结合位点的突变
文章论证顺序:<p/>TTF-1调节了胆固醇<p/>TTF-1调节ABCA1的表达(分别做了RNA和蛋白)<p/>ABCA1是TTF-1直接作用的靶基因<p/>TTF-1促进胆固醇的流出(做表型)
创新的地方:主变量和因变量机制/主变量表型创新
- 文章数据理解:
1)主变量介导表型(Fig.1;Fig 5 一正一反;细胞动物)
2)两个表型相互嵌套(Fig 6 +IC50+加上了耐药的表型)
3)TTF-1影响ABCA1的表达(Fig2 ;qPCR筛选可能受TTF-1调控的脂代谢的差异表达基因,证明TTF-1正向调节ABCA1mRNA+蛋白+ 细胞动物验证);从而负调节胆固醇的代谢(FIg.1),最终导致他汀类的耐药
4)证明TTF-1的靶基因是ABCA1(直接机制的体现)-----用了荧光素酶实验(TTF-1过表达后可以显著提升ABCA1启动子的转录活性)+Chi-QPCR;分成三段验证TTF-1的结合位点(证明绿色是有结合转录活性的+突变后证明两个位点都是必须的);Rescue出现了表型的回复
转录因子论证格式:
1)功能基因:临床相关性(用了样本数据库--表达差异分析+生存曲线差异+临床相关性)----一正一反;细胞动物------分子机制(下游间接机制+
Rescue验证表型:使用了通路抑制剂)
2)lncRNA:高通量筛选+猜------筛到了分子,进行亚细胞的定位/表达----验证表型:细胞动物;一正一反-----分子机制:上游间接机制/下游间接机制/(三元变量)+Rescue
3)转录因子:细胞表型(一正一反)----间接机制(筛选了下游的分子;是否有差异表达的基因)----直接机制(荧光报告基因/结合位点验证:分为3段/蛋白与基因交互的Chi实验)----验证嵌套的第二个表型(细胞动物;一正一反)
转录因子---靶基因(直接机制)----表型(已知)---疾病(已知)
单变量:因此恒量中剩下
模:验证表型;细胞(高/低表达的细胞模型)动物;一正一反(RNAi+CRISPR);Rescue验证表型是否可以回复
法:多实验佐证
标:多标志物佐证
二元变量:
1)调控关系:寻找下游或上游的调控靶分子;操作上游变量验证下游变量变化
原理:转录因子(活性增强或减弱)---靶基因表达变化----表型变化
回复验证:验证表型回复
过表达转录因子+抑制下游靶基因+看表型回复
沉默转录因子+过表达靶基因+看表型恢复
2)直接机制验证
- 转录因子的交互作用:Luciferase/Chi/EMSA
-
结合位点的验证:分段看结合活性/突变该区域看是否有变化