编码区
编辑基因的编码区,也称为编码序列 (CDS),是基因的 DNA 或 RNA 中编码蛋白质的部分。 与不同物种和时间段的非编码区相比,研究编码区的长度、组成、调控、剪接、结构和功能,可以提供有关原核生物和真核生物基因组织和进化的大量重要信息。 这可以进一步帮助绘制人类基因组图和开发基因疗法。
定义
编辑虽然这个术语有时也与外显子互换使用,但它们并不完全相同:外显子由编码区以及 RNA 的 3' 和 5' 非翻译区组成,因此,外显子 将部分由编码区组成。 RNA 的 3' 和 5' 非翻译区不编码蛋白质,称为非编码区,本页不予讨论。
编码区和外显子组之间经常存在混淆,但这些术语之间有明显的区别。 外显子组是指基因组中的所有外显子,而编码区是指专门编码某种蛋白质的 DNA 或 RNA 的单个部分。
历史
编辑这是xxx个迹象表明需要区分基因组中编码蛋白质的部分(现在称为编码区)和不编码的部分。
组成
编辑证据表明,碱基组成模式和编码区可用性之间存在普遍的相互依赖关系。 编码区被认为比非编码区包含更高的 GC 含量。 进一步研究发现,编码链越长,GC含量越高。 短编码链的 GC 含量相对较低,类似于 TAG、TAA 和 TGA 等碱基组成翻译终止密码子的低 GC 含量。
富含 GC 的区域也是比例点突变类型略有改变的地方:与颠换相比,转换更多,即从嘌呤到嘌呤或嘧啶到嘧啶的变化,即从嘌呤到嘧啶或嘧啶到嘌呤的变化。 转换不太可能改变编码的氨基酸并保持沉默突变(特别是如果它们发生在密码子的第三个核苷酸),这通常在翻译和蛋白质形成过程中对生物体有益。
这表明与辅助和非必需区域(基因贫乏)相比,必需编码区域(富含基因)的 GC 含量更高,并且更稳定和抗突变。 然而,目前尚不清楚这是通过中性随机突变还是通过选择模式实现的。 还存在关于用于确定 GC 含量和编码区域之间关系的方法(例如基因窗口)是否准确和公正的争论。
结构与功能
编辑在 DNA 中,编码区的两侧是模板链 5' 端的启动子序列和 3' 端的终止序列。 在转录过程中,RNA 聚合酶 (RNAP) 与启动子序列结合并沿着模板链移动到编码区。 RNAP 然后添加与编码区互补的 RNA 核苷酸以形成 mRNA,用尿嘧啶代替胸腺嘧啶。 这一直持续到 RNAP 到达终止序列。
转录和成熟后,形成的成熟 mRNA 包含多个对其最终翻译成蛋白质很重要的部分。 mRNA 中的编码区两侧是 5' 非翻译区 (5'-UTR) 和 3' 非翻译区 (3'-UTR)、5' 帽和 Poly-A 尾。 在翻译过程中,核糖体有助于将 tRNA 附着到编码区,一次附着 3 个核苷酸(密码子)。 tRNA 将它们相关的氨基酸转移到不断增长的多肽链上,最终形成在初始 DNA 编码区中定义的蛋白质。
法规
编辑可以修饰编码区以调节基因表达。
烷基化是编码区的一种调节形式。 可以通过靶向特定序列来沉默本应被转录的基因。 该序列中的碱基将被烷基封闭,从而产生沉默效应。
虽然基因表达的调节管理着细胞中 RNA 或蛋白质的丰度,但这些机制的调节可以通过在 DNA 链中开放阅读框开始之前发现的调节序列来控制。 然后调节序列将决定蛋白质编码区表达发生的位置和时间。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/228753/