加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

人類學雜記——3. Y染色體的突變和譜系

(2011-11-23 20:15:12)
标签:

y染色體

人類學

突變

snp

str

單倍羣

分类: 人類學雜記
(溫馨提示:簡化字版本見後。)

本篇文章的內容和我之前做過的科普視頻很多是重複的,可以先看一下這個視頻:
(視頻裏少數內容現在來看有所過時,但問題不大。)

之前已經講過,每個男人的Y染色體都是從他的父親傳下來的。染色體在傳遞過程中,不總是完完全全一成不變地傳下來的,而是有時會發生突變。鹼基替換有以下若干種類型(初學者先明白SNP,再看看STR就行,别的可以以後有空再理解,先看過之後的內容,回頭再來理解能容易一些):

一、單鹼基替換
一般用SNP表示(習慣上讀“snip”),SNP是single nucleotide polymorphism的縮寫,即“單核苷酸多態”。就是A變成T,或者A變成G這種。下圖這種情況就是SNP,每行代表一個人的序列(這只是示意圖,實際Y染色體的SNP不會有這麼高密度的):

http://s12/middle/465ddf794b265f64938fb&690Y染色體的突變和譜系" TITLE="人類學雜記——3. Y染色體的突變和譜系" />

在Y染色體簡單位置上(在染色體上只出現一次,且本身及附近沒有各種重複序列)的SNP突變是非常穩定的。這種突變在整個人類歷史上一般只突變過一次,(上回說過,整個Y染色體有60 Mbp長,基本沒有重複的部分也有10 Mbp左右,每個位點發生突變的事件又是相互無關的,因此同一個位置發生兩次突變的概率極低)因此基本上,如果某個人的某個位點上發生了一次突變,他的子孫都會繼承這一個突變,而不是他的子孫的人則不會有這個突變。因此用Y染色體的SNP可以非常可靠地確定譜系演化關係。現在做分型時用的大多數位點都是單鹼基替換類型的。

二、鹼基插入/刪除(insertion/deletion,簡稱indel
這個是少數幾個鹼基(常見的有1 – 10個)的插入或者刪除,序列的總長度發生了變化。一般也把小的indel算作廣義上SNP的一類。在簡單位置上的indel發生比通常的單鹼基替換還要難,且也是不可逆的,同樣也可以用作可靠的譜系標記。

三、短串聯重複序列(short tandem repeat, STR),又稱微衞星標記(microsatellite
就是DNA序列裏面有時會出現少數幾個鹼基的序列(通常是1 – 6個,分析時最常用的是3 – 5個鹼基長的)連續出現很多次的情況。比如下例中,ATT的三鹼基序列連續出現了12次:
http://s12/middle/465ddf794b265fd737a5b&690Y染色體的突變和譜系" TITLE="人類學雜記——3. Y染色體的突變和譜系" />
簡單表示就是:
http://s12/middle/465ddf794b265fd85bd6b&690Y染色體的突變和譜系" TITLE="人類學雜記——3. Y染色體的突變和譜系" />

這種序列在複製的過程中最經常發生的突變是重複數變多或者變少,也就是長度變化通常都是重複單元長的長度(這裏是3 bp)或其整倍數。重複數從12一般是變成11或者13,過若干代從11又可能變成10或變回11。更少見的情況下也會一次變多或變少兩三個重複單元,比如從12直接變到14這樣。

STR突變因爲會在同一個點上反復發生,方向也不一定,不能像SNP一樣說某個STR是多少的就肯定是哪一支的。但因爲其突變率高,多樣性也高(每個點有很多種可能性),在僅做幾個點的時候組合情況多,分辨率就高,此外容易標準化操作,所以法醫學上常用於排除父系親緣關係和尋找線索。但雖然STR組合遠的肯定不會是父系的近親,但STR近的卻有可能並非近親,只是偶然STR組合變得接近而已。

四、大片段變化
不詳細講了,有小衞星、CNV等等類型,就是上百個鹼基以至上Mbp(10⁶個鹼基)大的片段的增加或刪除。比較大的上Mbp的變化通常可以通過染色、顯微鏡檢觀察出來。有一個標記,M1(又叫YAP,定義DE單倍羣)突變,就是一個幾百bp長、稱作Alu的元件在Y染色體上的插入。

五、交換重組
Y染色體不像常染色體或X染色體,可以在減數分裂的時候和另一條同源的姐妹染色單體發生重組。但因爲Y染色體內部重複片段很多,這些片段之閒也容易發生同源重組。比如一個STR叫DYS385,出現在兩段同源且高度相似的區域上。測出了12, 18,可能是a段上是12,b段上是18,到下一代可能因爲重組互換倒過來,a段上成了18,b段上成了12。如果STR發生突變,可能從12, 18變成12, 19或者11, 18之類,也可能因爲重組時一段把同源的另一段替換,成了12, 12。如果SNP出現在Y染色體不唯一的位置上也會出現同樣的問題,有的SNP在檢測時會出現兩個峰(例如N單倍羣的LLY22g位點),且這種SNP容易有較複雜的變化。


因爲最可靠的標記是SNP提供的,現在的Y染色體樹就是通過一個個SNP畫出來的。比如有A、B、C三個人,B和C有M175這個SNP的突變(寫成M175+),A沒有M175的突變,即M175的原始型(寫成M175-)。而C有M122這個點的突變型(M122+),A和B都是M122-,那麼,因爲M175+的人包括了M122+和M122-的人,而M175-的人全都是M122-,說明M175發生得比M122早,後來有M175+的一個人又發生了M122的突變,M122更晚近,也就是說M175在M122的上游。做成樹就成了這樣:
http://s2/middle/465ddf794b265f65f0341&690Y染色體的突變和譜系" TITLE="人類學雜記——3. Y染色體的突變和譜系" />

那麼兩個男人望自己的父系推,到某個地方會發現都是同一個祖先,比如B和C都有一個發生了M175突變的祖先。把現在全世界的所有男人放一起望上推,最終也會推到一個始祖身上。這個男人稱作“Y染色體亞當”。這裏“亞當”只是共同始祖的一個代号,而非《聖經》裏面那個亞當。同理,把所有人的母系從線粒體望上推,也能推到唯一一個女性,稱作“線粒體夏娃”。但請注意,Y染色體亞當的時候並不是說當時只有一個男人,只是說只有他傳下了純父系的後代。和Y染色體亞當基本同時的還有他兒子的外公,這個人也是現代人的祖先,只是他的Y染色體沒有傳到現在。另外,Y染色體亞當和線粒體夏娃也不需要生活在同一個時代,因爲這兩個的定義是最近的共同祖先,Y染色體亞當仍有無數輩的父系祖先。

有了這棵樹,我們可以把共享某個位點突變型的(即有一個共同祖先的)那部分人歸成一類,稱作一個“單倍羣”(haplogroup)。例如,M175+的個體就是O單倍羣,也就是中國人中最常見的類型。至於每個單倍羣如果要都講清楚分佈在哪些地方、哪些族羣,這些不是一兩次能講完的,以後會慢慢涉及。

(解釋一下名稱:一個在檢測中完全不能區分開的單倍體(haploid,Y染色體、線粒體都是單倍體,相當於常染色體那樣的二倍體)的類型稱作“單倍型”(haplotype),比如一組17個STR全都相同的Y染色體就是一種單倍型。線粒體某一段完全相同(比如高變區)的也可稱爲一個單倍型。而一些關係較近的單倍型放在一起就組成了單倍羣。)

===============以下是簡化字版本=================

本篇文章的内容和我之前做过的科普视频很多是重复的,可以先看一下这个视频:http://v.youku.com/v_show/id_XMTcwNzU1NzE2.html (视频里少数内容现在来看有所过时,但问题不大。)

之前已经讲过,每个男人的Y染色体都是从他的父亲传下来的。染色体在传递过程中,不总是完完全全一成不变地传下来的,而是有时会发生突变。碱基替换有以下若干种类型(初学者先明白SNP,再看看STR就行,别的可以以后有空再理解,先看过之后的内容,回头再来理解能容易一些):

一、单碱基替换
一般用SNP表示(习惯上读“snip”),SNP是single nucleotide polymorphism的缩写,即“单核苷酸多态”。就是A变成T,或者A变成G这种。下图这种情况就是SNP,每行代表一个人的序列(这只是示意图,实际Y染色体的SNP不会有这么高密度的):
http://s12/middle/465ddf794b265f64938fb&690Y染色體的突變和譜系" TITLE="人類學雜記——3. Y染色體的突變和譜系" />

在Y染色体简单位置上(在染色体上只出现一次,且本身及附近没有各种重复序列)的SNP突变是非常稳定的。这种突变在整个人类历史上一般只突变过一次,(上回说过,整个Y染色体有60 Mbp长,基本没有重复的部分也有10M bp左右,每个位点发生突变的事件又是相互无关的,因此同一个位置发生两次突变的概率极低)因此基本上,如果某个人的某个位点上发生了一次突变,他的子孙都会继承这一个突变,而不是他的子孙的人则不会有这个突变。因此用Y染色体的SNP可以非常可靠地确定谱系演化关系。现在做分型时用的大多数字点都是单碱基替换类型的。

二、碱基插入/删除(insertion/deletion,简称indel
这个是少数几个碱基(常见的有1 – 10个)的插入或者删除,序列的总长度发生了变化。一般也把小的indel算作广义上SNP的一类。在简单位置上的indel发生比通常的单碱基替换还要难,且也是不可逆的,同样也可以用作可靠的谱系标记。

三、短串联重复序列(short tandem repeat, STR),又称微卫星标记(microsatellite
就是DNA序列里面有时会出现少数几个碱基的序列(通常是1 – 6个,分析时最常用的是3 – 5个碱基长的)连续出现很多次的情况。比如下例中,ATT的三碱基序列连续出现了12次:
http://s12/middle/465ddf794b265fd737a5b&690Y染色體的突變和譜系" TITLE="人類學雜記——3. Y染色體的突變和譜系" />
简单表示就是:
http://s12/middle/465ddf794b265fd85bd6b&690Y染色體的突變和譜系" TITLE="人類學雜記——3. Y染色體的突變和譜系" />

这种序列在复制的过程中最经常发生的突变是重复数变多或者变少,也就是长度变化通常都是重复单元长的长度(这里是3 bp)或其整倍数。重复数从12一般是变成11或者13,过若干代从11又可能变成10或变回11。更少见的情况下也会一次变多或变少两三个重复单元,比如从12直接变到14这样。

STR突变因为会在同一个点上反复发生,方向也不一定,不能像SNP一样说某个STR是多少的就肯定是哪一支的。但因为其突变率高,多样性也高(每个点有很多种可能性),在仅做几个点的时候组合情况多,分辨率就高,此外容易标准化操作,所以法医学上常用于排除父系亲缘关系和寻找线索。但虽然STR组合远的肯定不会是父系的近亲,但STR近的却有可能并非近亲,只是偶然STR组合变得接近而已。

四、大片段变化
不详细讲了,有小卫星、CNV等等类型,就是上百个碱基以至上Mbp(10⁶个碱基)大的片段的增加或删除。比较大的上Mbp的变化通常可以通过染色、显微镜检观察出来。有一个标记,M1(又叫YAP,定义DE单倍群)突变,就是一个几百bp长、称作Alu的组件在Y染色体上的插入。

五、交换重组
Y染色体不像常染色体或X染色体,可以在减数分裂的时候和另一条同源的姐妹染色单体发生重组。但因为Y染色体内部重复片段很多,这些片段之间也容易发生同源重组。比如一个STR叫DYS385,出现在两段同源且高度相似的区域上。测出了12, 18,可能是a段上是12,b段上是18,到下一代可能因为重组互换倒过来,a段上成了18,b段上成了12。如果STR发生突变,可能从12, 18变成12, 19或者11, 18之类,也可能因为重组时一段把同源的另一段替换,成了12, 12。如果SNP出现在Y染色体不唯一的位置上也会出现同样的问题,有的SNP在检测时会出现两个峰(例如N单倍群的LLY22g位点),且这种SNP容易有较复杂的变化。

因为最可靠的标记是SNP提供的,现在的Y染色体树就是通过一个个SNP画出来的。比如有A、B、C三个人,B和C有M175这个SNP的突变(写成M175+),A没有M175的突变,即M175的原始型(写成M175-)。而C有M122这个点的突变型(M122+),A和B都是M122-,那么,因为M175+的人包括了M122+和M122-的人,而M175-的人全都是M122-,说明M175发生得比M122早,后来有M175+的一个人又发生了M122的突变,M122更晚近,也就是说M175在M122的上游。做成树就成了这样:
http://s2/middle/465ddf794b265f65f0341&690Y染色體的突變和譜系" TITLE="人類學雜記——3. Y染色體的突變和譜系" />

那么两个男人望自己的父系推,到某个地方会发现都是同一个祖先,比如B和C都有一个发生了M175突变的祖先。把现在全世界的所有男人放一起望上推,最终也会推到一个始祖身上。这个男人称作“Y染色体亚当”。这里“亚当”只是共同始祖的一个代号,而非《圣经》里面那个亚当。同理,把所有人的母系从线粒体望上推,也能推到唯一一个女性,称作“线粒体夏娃”。但请注意,Y染色体亚当的时候并不是说当时只有一个男人,只是说只有他传下了纯父系的后代。和Y染色体亚当基本同时的还有他儿子的外公,这个人也是现代人的祖先,只是他的Y染色体没有传到现在。另外,Y染色体亚当和线粒体夏娃也不需要生活在同一个时代,因为这两个的定义是最近的共同祖先,Y染色体亚当仍有无数辈的父系祖先。

有了这棵树,我们可以把共享某个位点突变型的(即有一个共同祖先的)那部分人归成一类,称作一个“单倍群”(haplogroup)。例如,M175+的个体就是O单倍群,也就是中国人中最常见的类型。至于每个单倍群如果要都讲清楚分布在哪些地方、哪些族群,这些不是一两次能讲完的,以后会慢慢涉及。

(解释一下名称:一个在检测中完全不能区分开的单倍体(haploid,Y染色体、线粒体都是单倍体,相当于常染色体那样的二倍体)的类型称作“单倍型”(haplotype),比如一组17个STR全都相同的Y染色体就是一种单倍型。线粒体某一段完全相同(比如高变区)的也可称为一个单倍型。而一些关系较近的单倍型放在一起就组成了单倍群。)

首發於2011.11.23,新浪博客

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有