基因(Gene): 指产生一条有功能的蛋白质或RNA所需的全部核苷酸序列。
编码区CDS(coding sequence):是指编码一段蛋白产物的序列,是与蛋白质密码子一一对应的DNA序列。
开放阅读框(Open reading frame):是指从一个起始密码子开始到一个终止密码子结束的一段序列。
※ CDS与ORF的联系与区别:
并不是所有读码框都能表达出蛋白产物,或者能表达出占有优势或者能产生生物学功能的蛋白;CDS必定是一个ORF,但也可能包括多个ORF,相反,每个ORF不一定都是CDS。
ORF: -- translation(理论上存在的), CDS: -- transcription(事实存在的)
启动子(Promoter)和终止子(Terminator):
启动子和终止子都是一段特殊的DNA序列,属于基因的非编码区,分别位于编码区的上游和下游,负责调控基因的转录。
启动子 Promoter:
※ DNA分子上能与RNA聚合酶结合并形成转录起始复合体的区域。
终止子 Terminator:
※ 转录过程中能能够终止RNA聚合酶转录的DNA序列。
起始密码子(Start codon)和终止密码子(Stop codon) :
起始密码子和终止密码子都是mRNA上三联体碱基序列,分别决定翻译的起始和终止。
起始密码子Start codon:
✔ 指mRNA上开始合成蛋白质的密码子,也是第一个被核糖体翻译的mRNA上的密码子,位于编码区内,紧邻5'非翻译区。
终止密码子Stop codon:
✔ 终止肽链合成的mRNA的三联体碱基序列(UAA、UAG、UGA),它们不编码蛋白质。
UTR(Untranslated Regions):转录非翻译区,是mRNA分子两端的非编码片段。
5'-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至起始密码子AUG
3'-UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的前端。