刘小泽写于2020.2.8
大概回顾一下基础知识
一:ORF与CDS
ORF:open reading frame(开放阅读框)
它是理论上的蛋白编码区,一般是先在DNA序列中寻找起始密码子(AUG)对应的序列ATG,然后按每3个碱基一组向后延伸,一直到出现终止密码子(UAG、UGA、UAA)对应的序列
注意:起始密码子和启动子不是一回事!
CDS:coding sequences (编码区)
它就是与蛋白序列一一对应的DNA序列,并且序列中间不存在其他与蛋白无关的序列,和真实情况最接近
举个例子:
例如这个序列:AACGCATGCAGC
如果用预测的方法得到ORF,它会先找到ATG;然后会以中间的字母T为核心,推测三种可能:
- 第一种:T就是在中心,即ATG,然后按每三个一组,得到:CGC、ATG、CAG
- 第二种:T在左侧,即TGC,同样得到AAC、GCA、TGC、AGC【这就是真实的CDS组合】
- 第三种::T在右侧,即CAT,得到ACG、CAT、GCA
还因为DNA双链,所以总共有32=6种不同密码子组合方式*
补充
CDS 与 UTR:
A typical CDS starts with ATG and ends with a stop codon, it doesn't have any introns, 5'- and 3'-UTR
CDS与ORF:
CDS can be a subset of an open reading frame (ORF).
二:启动子&起始密码子;终止子&终止密码子**
实际上二者之间没有任何关联
- 启动子和终止子都是一段特殊的DNA序列,属于基因的非编码区,分别位于编码区的上游和下游,负责调控基因的转录
- 起始密码子和终止密码子都是mRNA上的三联体碱基序列,分别决定翻译的起始和终止。
启动子 promoter
DNA分子上能与RNA聚合酶结合并形成转录起始复合体的区域
与RNA聚合酶结合并能起始mRNA合成的序列。做生信分析时,有的选择上游1 kb,下游 500 nt,也有选上下游各1 kb的
强启动子(strong promoter):对RNA聚合酶有很高亲和力的启动子,可以指导合成大量的mRNA
起始密码子 start codon
指定信使RNA(mRNA)上开始合成蛋白质的密码子,也是第一个被核糖体翻译的mRNA上的密码子,位于编码区内,紧邻5′非翻译区。较为常见的起始密码子是AUG
终止子 terminator
- 转录过程中能够终止RNA聚合酶转录的DNA序列
- 终止子可分为两类:一类不依赖于蛋白质辅因子就能实现终止作用。另一类则依赖蛋白辅因子才能实现终止作用
终止密码子 stop codon
终止肽链合成的信使核糖核酸(mRNA)的三联体碱基序列,UAA、UAG和UGA,它们不编码氨基酸
三:转录因子 及结合位点
转录因子(transcription factor)
一群能与基因5`端上游特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子,这些蛋白质能调控其基因的转录。
调控方法是转录因子可以调控核糖核酸聚合酶(RNA聚合酶,或叫RNA合成酶)与DNA模板的结合
更详细的转录因子介绍:https://cloud.tencent.com/developer/article/1376739
TF结合位点 transcription factor binding site,TFBS
转录因子调节基因表达时,与基因模板链结合的区域。一般应该分布在基因前端【但:人21和22号染色体上,只有22%的转录因子结合位点分布在蛋白编码基因的5'端】
四:UTR (Untranslated Regions)
非翻译区,是信使RNA(mRNA)分子两端的非编码片段
- 5'-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子
- 3'-UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的前端
最后补充几张图
关于表达调控
BIOL2060: Regulation of Gene Expression
欢迎关注我们的公众号~_~
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到jieandze1314@gmail.com