加载中…
个人资料
polyhedron
polyhedron 新浪个人认证
  • 博客等级:
  • 博客积分:0
  • 博客访问:500,037
  • 关注人气:1,460
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

人類學雜記——10. 漢族中有多少北方民族的血液?

(2012-04-17 15:34:40)
标签:

分子人類學

漢族

胡人

蒙古

y染色體

父系

母系

分类: 人類學雜記
人類學雜記——10. 漢族中有多少北方民族的血液?

(溫馨提示:簡化字版本見後。)

我必須承認這個題目不是很好寫。現在网絡上關於漢族起源的各種聲音都不少,有主張漢族都是炎黃子孫的,有說某個方言的漢族族羣是最純正漢族的,有說南方漢人主要是土著漢化的,有說北方人是胡種的。其實這些說法很多都是片面的,有出於政治目的的,有因爲偏見的,也有很多是出於顯示本族羣的正統性而貶抑其他族羣而製造出來的。我希望借本文從我現有的分子人類學數據中舉出一些事實而還原出一部分眞相。

本文所指的漢族就是目前一般意義上的漢族,可以暫時先不管近幾十年內漢族和其他民族通婚的後代,而包括了全國各省和各大方言區的漢族。至於漢族是什麼定義,血統還是文化上的,這個問題不在本文攷慮範圍。好在不論什麼定義的漢族,在現今狀態下包含的人差不太多。本文更不支持通過血統,尤其是單純根據Y染色體來劃分民族屬性的做法。本文就是想通過事實,盡可能還原歷史上眞正發生過的事情。

我之前的《人類學雜記》系列(http://blog.sina.com.cn/s/articlelist_1180557177_3_1.html )中也提到,人的遺傳物質分爲常染色體、X染色體、Y染色體和線粒體。常染色體能顯示每個個人及人羣的血統混合比例,以及族羣之閒和個人之閒的遠近關係,但因爲難以作演化樹(只能作聚類樹,而聚類樹並不能顯示眞實的演化關係),並不能反映血統的流向關係;X染色體因爲複雜的遺傳模式(女性兩條,可發生重組,男性一條),目前不能較好分析,且其遺傳規律仍會較接近常染色體;Y染色體反映父系;線粒體反映母系。

先說Y染色體,大家已經大概知道,漢族的最主要類型是O3-M122,占到一大半,其餘的包括O1-M119, O2-M268, C3-M217, N-M231, Q-M242等等。如果把省份分成北、東、南三塊,華東按江、浙、滬、皖四省市(因爲在復旦收樣,這些地方樣本比較多),其餘的省按通常意義的南北方來分。大體結果如表所示:

人類學雜記——10. <wbr>漢族中有多少北方民族的血液?

首先可以看出,漢族,不論北方、華東或南方,最常見的單倍羣是相當一致的。尤其O3下面的O3a2c1a-M117, O3a2c1*-M134(xM117)以及O3a1c-002611三支,其總和占了整個漢族的45%左右,在南北方總體來說差別都不大(除M134xM117在北方比南方略高)。在漢族中總體比較均勻的,還有N和O2*這兩大單倍羣。這五大支,我認爲都是屬於華夏較早期的成分,應該是5000-2000年前居住在黃河流域的。盡管這幾大支很可能不是同時同地擴張的,可能也不都是華夏最早的主要組成,但至少在漢族第一次大規模南遷(東晉)之前,以上的成分已經相對混合得比較均勻了,因此南遷時能以大致相似的相對比例進入南方漢人。

O1(尤其是其下的O1a1-P203支)在華東和南方比例明顯比北方多。攷慮到O1在4000多年前在長江三角洲的良渚文化的古DNA中已經有很高比例(Li H. et al. 2007),可以認爲華東和南方的O1至少很大一部分來自百越羣體。不過,攷慮到北方漢族也有4%的O1,尤其在西部的回族、羌族,甚至東北的一些民族中也有一定比例的O1來看,不應把O1的來源完全歸結爲越人。

O2包括O2*-M268(xPK4,M176)、O2a-PK4(下含O2a1-M95)和O2b-M176。從上表來看,O2*在全國是均勻的,O2a-PK4明顯在南方多一些。攷慮到南方少數民族中南亞、僮侗、苗瑤等民族中普遍有高頻的O2a的分佈,我們可以認爲,南方漢族中的O2a主要是從少數民族中融入的。但同O1的情況,在各處漢族和北方少數民族也普遍有低頻的O2a存在來看,O2a可能也是在早期漢族中即存在的。

C3-M217是一個需要仔細討論的問題。中國的C基本上都屬C3(南方有很少數的CxC3)。C和D一樣,是早期(應該在6 – 3万年前)到達東亞的單倍羣。C3的年齡大致也和整個O相當。我不很同意把C和D稱作“椶種人”或者“矮黑人”的提法,因爲一來Y染色體不與體質直接關聯,二來當C、D的人羣與N、O的人羣兩三万年前在東亞最初相遇時,誰比誰白也不好說,我覺得目前證據還不充足。

C3在北方的比例明顯比華東和華南高一些。參攷北方的阿爾泰語系民族,如蒙古族、滿族中普遍較高的C3比例(他們的C也主要都是C3),可以推測,北方漢族中偏高的C3是與北方民族相關的。

人類學雜記——10. <wbr>漢族中有多少北方民族的血液?
(002611包含在本表的O3*裏,占漢族17%左右,因爲早期的文獻不測002611這個點,表中沒有列。本表中的O3*相當於前面表中的M122, M324, 002611, M7四列的總和。兩表的原始樣本來源不同,數據稍有一兩個百分比的出入也是正常的。)

大家都知道,蒙古和滿人都曾經統治過中國。那麼漢族中的C3是否來源於蒙古人和滿人呢?Zerjal等人在2003年發現,在蒙古等大量阿爾泰人羣的C3*中,存在着一個特殊的STR組合(單倍型),稱作“星簇”(star-cluster),占了蒙古人的20%以上,從東北到中亞的很多民族裏也都有分佈:

人類學雜記——10. <wbr>漢族中有多少北方民族的血液?

這個單倍型擴張年代很新,根據Zerjal計算只有1000年多一些(我仍然堅持認爲用幾個到幾十個STR算出來的時閒準確性很差)。且不論這個星簇是否是成吉思汗的後裔(我的朋友蘭海可能會有專文來攷證此事),至少以其在蒙古中的比例,可以將其看作是蒙古擴張的一個標記。假如蒙古人大規模融入漢族(攷慮其當時的人口數,應該是均勻的),而假設漢族中有10%的父系是從蒙古人來的話,漢族就應該有不下2%的比例屬C3的星簇。

然而我檢査了上千份漢族的樣本,僅發現一例東北漢族屬於星簇(通過STR判斷),這個人的父親還是孤兒,不知道祖上原來姓什麼。這樣的話,就可以作出一個結論:漢族(包括北方漢族)父系中幾乎不存在從蒙古人混入的成分。即使有的話,混入比例也不超過1%。

此外,在北部通古斯人(鄂倫春、鄂溫克、赫哲)和部分蒙古族和哈薩克族中存在大量的(>30%)C3c-M48單倍羣,滿族中也有少量,而這個類型目前也未在我的漢族樣本中發現一例(在另一未公開的北方某省上千例漢族樣本中發現了3例)。這也能說明漢族中基本不存在蒙古來源。

滿族的來源中本來就有大量漢人,從前面表中可見漢族的各主要成分在滿族中都有一定比例。滿族中C3星簇的比例比蒙古族中略少(8%左右),評價滿人在漢族中混合比例稍爲困難一些。但有清一代,滿族(旗人)都能記住自己的身份,基本到目前還都是能知道自己父系的,較少有父系旗人的人在民族劃分時算作漢族。漢族和滿族的父系關系,主要還是漢族的父系進入滿族(主要是滿族三四百年前形成時,另外不排除近年來隨母親民族進入的)。

那麼北方漢族中比例較高的C3是什麼來源呢?不能排除是東晉前C3已大量存在於漢族,但未混勻。也可能是後來鮮卑等民族大量融入。因爲目前已無鮮卑的直系後裔民族,古DNA的Y染色體結果也還很有限,還不能驗證這些C3是否源於鮮卑。但可以肯定的是,如此高比例的C3不是蒙古來源。

通過類似的方法,也可以評估日本侵華時是否在中國遺留下後代。日本有35%的D型,都屬D2-M55。這個型代表了日本舊石器時期的早期居民——繩文人。除日本列島外,D2只在朝鮮半島存在低於1%的比例。目前,在大量的漢族數據中也沒測到一例D2。說明日本人的父系沒有混入漢族。

後面說一下代表母系遺傳的線粒體。文波等人2004年的硏究以及薛付忠等人2008年的硏究表明,南北漢族的父系是相當一致的,不存在一個明顯的南北界線(如本文前面所述)。中國南方的漢化主要應歸功於北方漢人的人口南遷,只有小部分是南方土著漢化融入。但線粒體的南北有較明顯的區別,最明顯的界線正是在大約秦嶺-淮河一線。

人類學雜記——10. <wbr>漢族中有多少北方民族的血液?

這說明,母系在漢族中的混合不如父系均勻,一個地方的土著母系在有大量移民遷入時仍能保持較高的原有比例。這個從一般的人口遷徙規律也容易理解:本身男性比女性更容易進行長距離移動並移民定居(相反,鄉村一級的母系比父系流動更普遍)。歷史上的移民還有不少是軍隊的移動,有時是不攜帶女性的,這時就需要找當地女性結婚。漢族男性相比土著擁有較高社會地位和較多財富也是歷史上漢族父系占優勢的原因。

另外,還需要攷慮到東亞絕大多數民族是父系社會。同一個父系的子女生活在一起,經常形成同姓村,而女性在嫁娶時流動。這樣,孩子的語言、民族屬性等一般都是隨父親的。這也是Y染色體(父系)和民族關聯更緊密,而線粒體(母系)和地理區域關聯更緊密的原因。

仍然要嘮叨一句:Y染色體只是DNA的衆多標記裏其中的一個而已。人的全基因組有3 Gbp × 2(二倍體),而Y染色體只有60 Mbp,上面僅有幾個基因,既不決定體質、相皃等等,也幾乎和各種疾病無關。之所以常用Y染色體來硏究只是因爲遺傳模式簡單、容易硏究,能相對說得清楚一些。忽略了n代前的2ⁿ-1個祖先而只管一個純父系祖先傳下來的遺傳物質,也忽略掉各種文化屬性,而簡單用Y染色體來判斷一個人的族屬,無疑是荒謬的。另外,現在的Y染色體硏究也還未達到透徹,仍需要檢測更大數量的樣本(繼續歡迎大家來找我抽血測試,離上海越遠的越好,http://www.ranhaer.com/thread-14446-1-1.html ,經常推出各種打折優惠)及更細化的SNP標記。网上某些人那樣只看見一個C就說是蒙古人,看見N就是北亞,看見Q就是印地安,看見O1就是百越這種簡單的論調現在已經不值一駁了。

參攷文獻:

Li, H., Y. Huang, et al. (2007). "Y chromosomes of prehistoric people along the Yangtze River." Human Genetics 122: 383-388.

Zerjal, T., Y. L. Xue, et al. (2003). "The genetic legacy of the Mongols." American Journal of Human Genetics 72(3): 717-721.

Wen, B., H. Li, et al. (2004). "Genetic evidence supports demic diffusion of Han culture." Nature 431(7006): 302-305.

Xue, F. Z., Y. Wang, et al. (2008). "A spatial analysis of genetic structure of human populations in China reveals distinct difference between maternal and paternal lineages." European Journal of Human Genetics 16(6): 705-717.


===============以下是簡化字版本=================

人类学杂记——10. 汉族中有多少北方民族的血液?

我必须承认这个题目不是很好写。现在网络上关于汉族起源的各种声音都不少,有主张汉族都是炎黄子孙的,有说某个方言的汉族族群是最纯正汉族的,有说南方汉人主要是土著汉化的,有说北方人是胡种的。其实这些说法很多都是片面的,有出于政治目的的,有因为偏见的,也有很多是出于显示本族群的正统性而贬抑其他族群而制造出来的。我希望借本文从我现有的分子人类学数据中举出一些事实而还原出一部分真相。

本文所指的汉族就是目前一般意义上的汉族,可以暂时先不管近几十年内汉族和其他民族通婚的后代,而包括了全国各省和各大方言区的汉族。至于汉族是什么定义,血统还是文化上的,这个问题不在本文考虑范围。好在不论什么定义的汉族,在现今状态下包含的人差不太多。本文更不支持通过血统,尤其是单纯根据Y染色体来划分民族属性的做法。本文就是想通过事实,尽可能还原历史上真正发生过的事情。

我之前的《人类学杂记》系列(
http://blog.sina.com.cn/s/articlelist_1180557177_3_1.html )中也提到,人的遗传物质分为常染色体、X染色体、Y染色体和线粒体。常染色体能显示每个个人及人群的血统混合比例,以及族群之间和个人之间的远近关系,但因为难以作演化树(只能作聚类树,而聚类树并不能显示真实的演化关系),并不能反映血统的流向关系;X染色体因为复杂的遗传模式(女性两条,可发生重组,男性一条),目前不能较好分析,且其遗传规律仍会较接近常染色体;Y染色体反映父系;线粒体反映母系。

先说Y染色体,大家已经大概知道,汉族的最主要类型是O3-M122,占到一大半,其余的包括O1-M119, O2-M268, C3-M217, N-M231, Q-M242等等。如果把省份分成北、东、南三块,华东按江、浙、沪、皖四省市(因为在复旦收样,这些地方样本比较多),其余的省按通常意义的南北方来分。大体结果如表所示:

人類學雜記——10. <wbr>漢族中有多少北方民族的血液?

首先可以看出,汉族,不论北方、华东或南方,最常见的单倍群是相当一致的。尤其O3下面的O3a2c1a-M117, O3a2c1*-M134(xM117)以及O3a1c-002611三支,其总和占了整个汉族的45%左右,在南北方总体来说差别都不大(除M134xM117在北方比南方略高)。在汉族中总体比较均匀的,还有N和O2*这两大单倍群。这五大支,我认为都是属于华夏较早期的成分,应该是5000-2000年前居住在黄河流域的。尽管这几大支很可能不是同时同地扩张的,可能也不都是华夏最早的主要组成,但至少在汉族第一次大规模南迁(东晋)之前,以上的成分已经相对混合得比较均匀了,因此南迁时能以大致相似的相对比例进入南方汉人。

O1(尤其是其下的O1a1-P203支)在华东和南方比例明显比北方多。考虑到O1在4000多年前在长江三角洲的良渚文化的古DNA中已经有很高比例(Li H. et al. 2007),可以认为华东和南方的O1至少很大一部分来自百越群体。不过,考虑到北方汉族也有4%的O1,尤其在西部的回族、羌族,甚至东北的一些民族中也有一定比例的O1来看,不应把O1的来源完全归结为越人。

O2包括O2*-M268(xPK4,M176)、O2a-PK4(下含O2a1-M95)和O2b-M176。从上表来看,O2*在全国是均匀的,O2a-PK4明显在南方多一些。考虑到南方少数民族中南亚、壮侗、苗瑶等民族中普遍有高频的O2a的分布,我们可以认为,南方汉族中的O2a主要是从少数民族中融入的。但同O1的情况,在各处汉族和北方少数民族也普遍有低频的O2a存在来看,O2a可能也是在早期汉族中即存在的。

C3-M217是一个需要仔细讨论的问题。中国的C基本上都属C3(南方有很少数的CxC3)。C和D一样,是早期(应该在6 – 3万年前)到达东亚的单倍群。C3的年龄大致也和整个O相当。我不很同意把C和D称作“棕种人”或者“矮黑人”的提法,因为一来Y染色体不与体质直接关联,二来当C、D的人群与N、O的人群两三万年前在东亚最初相遇时,谁比谁白也不好说,我觉得目前证据还不充足。

C3在北方的比例明显比华东和华南高一些。参考北方的阿尔泰语系民族,如蒙古族、满族中普遍较高的C3比例(他们的C也主要都是C3),可以推测,北方汉族中偏高的C3是与北方民族相关的。

人類學雜記——10. <wbr>漢族中有多少北方民族的血液?
(002611包含在本表的O3*里,占汉族17%左右,因为早期的文献不测002611这个点,表中没有列。本表中的O3*相当于前面表中的M122, M324, 002611, M7四列的总和。两表的原始样本来源不同,数据稍有一两个百分比的出入也是正常的。)

大家都知道,蒙古和满人都曾经统治过中国。那么汉族中的C3是否来源于蒙古人和满人呢?Zerjal等人在2003年发现,在蒙古等大量阿尔泰人群的C3*中,存在着一个特殊的STR组合(单倍型),称作“星簇”(star-cluster),占了蒙古人的20%以上,从东北到中亚的很多民族里也都有分布:

人類學雜記——10. <wbr>漢族中有多少北方民族的血液?
这个单倍型扩张年代很新,根据Zerjal计算只有1000年多一些(我仍然坚持认为用几个到几十个STR算出来的时间准确性很差)。且不论这个星簇是否是成吉思汗的后裔(我的朋友兰海可能会有专文来考证此事),至少以其在蒙古中的比例,可以将其看作是蒙古扩张的一个标记。假如蒙古人大规模融入汉族(考虑其当时的人口数,应该是均匀的),而假设汉族中有10%的父系是从蒙古人来的话,汉族就应该有不下2%的比例属C3的星簇。

然而我检査了上千份汉族的样本,仅发现一例东北汉族属于星簇(通过STR判断),这个人的父亲还是孤儿,不知道祖上原来姓什么。这样的话,就可以作出一个结论:汉族(包括北方汉族)父系中几乎不存在从蒙古人混入的成分。即使有的话,混入比例也不超过1%。

此外,在北部通古斯人(鄂伦春、鄂温克、赫哲)和部分蒙古族和哈萨克斯坦族中存在大量的(>30%)C3c-M48单倍群,满族中也有少量,而这个类型目前也未在我的汉族样本中发现一例(在另一未公开的北方某省上千例汉族样本中发现了3例)。这也能说明汉族中基本不存在蒙古来源。

满族的来源中本来就有大量汉人,从前面表中可见汉族的各主要成分在满族中都有一定比例。满族中C3星簇的比例比蒙古族中略少(8%左右),评价满人在汉族中混合比例稍为困难一些。但有清一代,满族(旗人)都能记住自己的身份,基本到目前还都是能知道自己父系的,较少有父系旗人的人在民族划分时算作汉族。汉族和满族的父系关系,主要还是汉族的父系进入满族(主要是满族三四百年前形成时,另外不排除近年来随母亲民族进入的)。

那么北方汉族中比例较高的C3是什么来源呢?不能排除是东晋前C3已大量存在于汉族,但未混匀。也可能是后来鲜卑等民族大量融入。因为目前已无鲜卑的直系后裔民族,古DNA的Y染色体结果也还很有限,还不能验证这些C3是否源于鲜卑。但可以肯定的是,如此高比例的C3不是蒙古来源。

通过类似的方法,也可以评估日本侵华时是否在中国遗留下后代。日本有35%的D型,都属D2-M55。这个型代表了日本旧石器时期的早期居民——绳文人。除日本列岛外,D2只在朝鲜半岛存在低于1%的比例。目前,在大量的汉族数据中也没测到一例D2。说明日本人的父系没有混入汉族。

后面说一下代表母系遗传的线粒体。文波等人2004年的研究以及薛付忠等人2008年的研究表明,南北汉族的父系是相当一致的,不存在一个明显的南北界线(如本文前面所述)。中国南方的汉化主要应归功于北方汉人的人口南迁,只有小部分是南方土著汉化融入。但线粒体的南北有较明显的区别,最明显的界线正是在大约秦岭-淮河一线。

人類學雜記——10. <wbr>漢族中有多少北方民族的血液?
这说明,母系在汉族中的混合不如父系均匀,一个地方的土著母系在有大量移民迁入时仍能保持较高的原有比例。这个从一般的人口迁徙规律也容易理解:本身男性比女性更容易进行长距离移动并移民定居(相反,乡村一级的母系比父系流动更普遍)。历史上的移民还有不少是军队的移动,有时是不携带女性的,这时就需要找当地女性结婚。汉族男性相比土著拥有较高社会地位和较多财富也是历史上汉族父系占优势的原因。

另外,还需要考虑到东亚绝大多数民族是父系社会。同一个父系的子女生活在一起,经常形成同姓村,而女性在嫁娶时流动。这样,孩子的语言、民族属性等一般都是随父亲的。这也是Y染色体(父系)和民族关联更紧密,而线粒体(母系)和地理区域关联更紧密的原因。

仍然要唠叨一句:Y染色体只是DNA的众多标记里其中的一个而已。人的全基因组有3 Gbp × 2(二倍体),而Y染色体只有60 Mbp,上面仅有几个基因,既不决定体质、相貌等等,也几乎和各种疾病无关。之所以常用Y染色体来研究只是因为遗传模式简单、容易研究,能相对说得清楚一些。忽略了n代前的2ⁿ-1个祖先而只管一个纯父系祖先传下来的遗传物质,也忽略掉各种文化属性,而简单用Y染色体来判断一个人的族属,无疑是荒谬的。另外,现在的Y染色体研究也还未达到透彻,仍需要检测更大数量的样本(继续欢迎大家来找我抽血测试,离上海越远的越好,
http://www.ranhaer.com/thread-14446-1-1.html ,经常推出各种打折优惠)及更细化的SNP标记。网上某些人那样只看见一个C就说是蒙古人,看见N就是北亚,看见Q就是印地安,看见O1就是百越这种简单的论调现在已经不值一驳了。

参考文献:

Li, H., Y. Huang, et al. (2007). "Y chromosomes of prehistoric people along the Yangtze River." Human Genetics 122: 383-388.

Zerjal, T., Y. L. Xue, et al. (2003). "The genetic legacy of the Mongols." American Journal of Human Genetics 72(3): 717-721.

Wen, B., H. Li, et al. (2004). "Genetic evidence supports demic diffusion of Han culture." Nature 431(7006): 302-305.

Xue, F. Z., Y. Wang, et al. (2008). "A spatial analysis of genetic structure of human populations in China reveals distinct difference between maternal and paternal lineages." European Journal of Human Genetics 16(6): 705-717.

首發於2012.04.17,新浪博客


0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有