真核生物基因组的复杂性
(2012-07-13 15:43:44)
标签:
表达调控真核生物真核基因组重复序列原核生物教育 |
分类: 基因表达调控 |
与原核生物比较,真核生物的基因组更为复杂,可列举如下。
▲真核基因组比原核基因组大得多,多复制起始点,多基因家族,超基因家族。大肠杆菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。
▲真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。
▲原核生物的基因组基本上是单倍体,而真核基因组体细胞是二倍体。
▲如前所述,细菌多数基因按功能相关成串排列,组成操纵子的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。
单顺反子mRNA:一个mRNA仅包含一种蛋白质的编码信息,即只含有一个开放可读框(ORF),这种mRNA称为单顺反子mRNA;真核生物mRNA通常是这种情况。
多顺反子mRNA:一个mRNA包含多个蛋白质的编码信息,即包含多个个开放可读框(ORF),这种mRNA称为多顺反子mRNA;这些蛋白质通常具有同一种相关的功能,并且成组的被一个操纵子(operon)所调控;原核生物mRNA通常是这种情况。
▲原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,非编码序列占基因组的90%以上。
▲原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。
▲原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列(repetitive sequences)。用复性动力学等实验表明有三类重复序列:
1、高度重复序列(highly repetitive sequences):基因组中有数千个到几百万个拷贝的DNA序列。这类序列一般较短,长10-300bp,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。高度重复顺序又按其结构特点分为三种:http://baike.baidu.com/view/3874641.htm
(1)倒位(反向)重复序列
(2)卫星DNA
(3)较复杂的重复单位组成的重复顺序
高度重复顺序的功能:
a.参与复制水平的调节反向序列常存在于DNA复制起点区的附近。另外,许多反向重复序列是一些蛋白质(包括酶)和DNA的结合位点。
b.参与基因表达的调控DNA的重复顺序可以转录到核内不均一RNA分子中,而有些反向重复顺序可以形成发夹结构,这对稳定RNA分子,免遭分解有重要作用.
c.参与转位作用几乎所有转位因子的末端都包括反向重复顺序,长度由几个bp到1400bp。由于这种顺序可以形成回文结构,因此在转位作用中即能连接非同源的基因,又可以被参与转位的特异酶所识别。
d.与进化有关不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性。如人的α卫星DNA长度仅差1个碱基(前者为171bp,后者为172bp),而且碱基序列有65%是相同的,这表明它们来自共同的祖先。在进化中某些特殊区段保守的,而其他区域的碱基序列则累积着变化。
e.同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹。
f.α卫星DNA成簇的分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关,即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DNA顺序。
2、中度重复序列(moderately repetitive sequences),这类序列多数长100-500bp,重复101-105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-×105次,在人的基因组中约占7%,功能也还不很清楚。在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围。依据重复顺序的长度,中度重复顺序可分为两种类型:
(1)短分散片段(short interspersed repeated segments, SINES)
(2)长分散片段(Long interspersed repeated segments, LINES)
http://www.5ibio.com/html/jibenshiyanjishu/shengwumingci/20070208/4640.html
3、单拷贝序列(single copy sequences)。在整个基因组中只出现一次或少数几次的序列(也称为单拷贝基因),占哺乳类基因组的50-80%,在小鼠中约占基因组的70%,在人基因组中约占65%。实验证明,所有真核生物染色体可能均含重复序列,而原核生物一般只含单一序列。高度和中度重复序列的含量随真核生物物种的不同而变化。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。
从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,使现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。