首先是人类的Y染色体谱系树,我们按着Y染色体单倍体的不同把全人类(包括非洲)分为18个类型(用从A到R十八个字母代表),出现频率高,数量多的类型单独列出(如O、N),把小概率出现的类型列入上级母类(如F、P),这也就是类型上有逻辑上重合的缘故,这样做是为了使分类清晰,分析方便!
http://hiphotos.baidu.com/yuexiagulao/abpic/item/d9e8b0312c89ddb85fdf0ea3.jpg
人类出非洲,都带有M168的变异点,此后M168发展出三个支系,C—M130、D—YAP、F—M89,它们下又有不同的子类型。
F—M89是现代人中占压倒性的类型,大概全世界80%以上的人都有这个变异点。
F—M89有很多子类型,其中,K—M9是最重要的一个支系,亚欧大陆上,除了西亚地区和西伯利亚,世界岛上绝大部分民族都由K—M9的子孙构成,今天中国人(汉族)中,96%的人都是K—M9类型。
K—M9下面也有很多子类型,最重要的有两个,一个是ON—M214,另一个是P—M45。
前者(ON—M214)主要分布在东亚、东南亚、北亚东部、部分太平洋岛屿(以上都是O—M175子类型)和乌拉尔山两侧、北欧北部、东欧北部和北极圈内的爱斯基摩人(以下都是N—M231子类型)。中国人主体类型就是O—M175。
后者(P—M45)主要分布在欧洲大部(R—M173子类型)、西亚的伊朗、南亚的印度(R1a—M17子类型)、美洲印地安人(Q—P36子类型)等地区。其中,R—M173(包括M17),被认为是原始雅利安人的基因。
http://hiphotos.baidu.com/yuexiagulao/abpic/item/e40f711e7af6e7e41ad576af.jpg
回过头来再说最早的一支。
海洋居民,C—M130走的路线大概就是沿着海岸出发,从阿拉伯半岛—伊朗—印度—中南半岛,此后,这批M130的子孙分为两支系,NO.1支系向北进入西伯利亚,并最终进入了北美地区;NO.2支系向南进入澳大利亚,并扩散到整个太平洋诸岛。虽然我们的基因树上C—M130画的比较简单,但实际上C—M130并不单一,他们类型众多。
今天C—M130的后代主要分布在印度南部、北亚东部、日本、北美西部、澳大利亚、太平洋诸岛。在东亚地区,外蒙地区比例非常高,达到58%,还有哈萨克人、吉尔吉斯人、布里亚特人、比例都在60%以上,这些人群的类型(包括北美地区)都是C3—M217;M130的其他类型还有,日本的阿伊努人90%以上是C1—M8,另外,现代日本人(6.5%)、朝鲜人、满州人、阿穆尔人中,也有一定数量的C1。C2—M38,主要分布在澳大利亚和太平洋诸岛屿,C4、C5主要分布在南印度地区,在当地民族中能达到20%。在现在汉族人中,M130的比例小于3%。
D—YAP又被称为小黑矮人基因,是一支非常古老的基因,它和C—M130几乎同时走出非洲。现在D—YAP类型主要分布在印度安答曼群岛的安达曼人(100%)、藏族(58%)、土家族、彝族、瑶族、日本(34.7%)、朝鲜、满州人、缅甸人、克钦人。在汉族人中,D—YAP出现的频率小于1%。
http://hiphotos.baidu.com/yuexiagulao/abpic/item/11f02a97511cd47d54fb96b4.jpg
http://hiphotos.baidu.com/yuexiagulao/abpic/item/f8c377ec0121dfc12e2e21c0.jpg
一般认为,C—M130和D—YAP是第一批走出非洲的居民,代表了棕色人种的特征。他们曾经广泛分布在东亚地区。
此后,黄色人种从中亚人群中(黄+白)分化出来,并迅速进入东南亚地区(路径可能是穿过印度地区),后期黄色人种的成功,由于高产作物的种植和先进工具的使用,黄色人种人口数量开始爆炸。平原地区和温带地区,黄色人种迅速排除取代了棕色人种,由于过程时间特别短,两种人种甚至没发生融合,所以这些平原地区找不到棕色人种基因;而在高寒地区、高海拔高原山地、边缘海岛,由于气温低、氧气稀薄无法种植农作物或者大海阻隔无法到达,使得黄色人种无法在短时期内取代棕色人种,使得这个取代过程持续了几千甚至上万年,所以两个人种发生了交流,使得高寒地区(如蒙古地区)、高原山地(如西藏)、海岛(如日本),这些地区虽然最终黄色人种占据了优势,但棕色人种的成分却被大量保存了下来。
附件一图是推测黄色人种和棕色人种扩散的路线(原作者:复旦大学李辉博士,我十分崇敬的一个人)
A图.
棕色人种大约10万年前走出非洲,至少在5万年之前已经来到东南亚;黄色人种(此时黄+白人群还没有开始分化)则是大约五万年前的时候开始向东迁徙;
B图.
大约4万年前,棕色人种已散布于东北亚到澳洲的广大地区,而黄色人种则进入了东南亚,路径最可能是中亚经过印度进入东南亚地区;
C图.
大约3万年前,黄色人种在东南亚、印度尼西亚次大陆和中国南方进一步扩张,而棕色人种可能有一部分已经来到美洲,注意:棕色人种此时没有停顿下来,他们也在扩散,但他们扩散的速度很慢,黄色人种扩散速度要快得多,后追过来的黄种人人群并把那些走的慢的部分吞没了;
D图.
大约2年前,黄色人种扩散到了整个东亚和东南亚地区,使该地区的棕色人种,除了高山和高寒地区、海岛地区外,都已经消失,北亚地区的棕色人种主体也被黄色人种大部分融合,成为黄种人;
E图.
大约1万年前,黄种人进入美洲,并成为美洲的主宰(注释:印地安人的mtDNA类型和东亚地区比较接近,而Y染色体介于黄色与白色中间,其中M120类型为印地安人和东亚人独有。);
F图.
在几千时间内,黄种人向中亚、北欧、印度洋和太平洋诸岛扩张,东亚最偏远地区(高山和海岛隔绝地区)的棕色人种也渐渐与黄种人融合,但印度洋上的安达曼群岛、马来群岛部分地区、澳大利亚还保存了棕色人种的基因。玻利尼西亚人都是黄棕混合的过渡类型,部分地区,黄色人种的成分略占优势,如汤加(82%是O—M175,比日本人还高),毛利人。另一支黄色人种则越过乌拉尔山,进入了北欧和东欧,在乌拉尔语系和斯拉夫语族中广泛分布他们的Y染色体(N—M214)。
附录二图,地理大发现前,几大人种的大致分布状态,过渡地区用了过渡的颜色,总体上说,还是比较准确,毕竟机械划分人种并不太合理
染色体变异数量多少并不能用人口数量来衡量,很多人口众多的大民族都是由一个小人群由于某种原因迅速壮大而来的,如历史上曾建立了强大帝国(典型的是汉人、阿拉伯人),近代的高技术革命和殖民(如英格兰人、西班牙人),这些人群的同源性强,Y染色体的变异类型并不特别丰富,相反,一些非常古老的小民族,其Y染色体变异类型却十分丰富,如:40万那加人(印度那加邦)的Y染色体类型就比11亿汉族人的类型还丰富,汉族人有的类型那加人基本上都有。
附录一图,主要是亚欧大陆上主要民族(图中的chinese主要指汉族,外国人对中国的民族状态不太了解)
附件二图,全球主要民族的单倍体构成和他们的亲源关系树,大陆和台湾是分着画的,没有标注,仔细看地理位置
推论的迁徙路线和时间(根据变异速率假说)
今天的汉族人,占压倒性主体的是O—M175。
具体分析,在M175下还可以细分为最大三个子支系(其他N多小类型都不算):O1—M119、O2—M95、O3—M122。
这三个子类型地理分布很有意思:
O1—M119广泛分布在从北亚到东南亚,但黄河流域竟几乎找不到!在贝加尔湖畔的布里亚特人,其O1—M119的比例最高,达34%,另外,北亚地区的外蒙、满州、朝鲜、日本、堪察加人等民族也有O1—M119类型,但一般比例不超过10%,中国南方,浙江、上海、福建等省份,O1—M119比例也较高。而在黄河流域的山东、河北地区的汉族人中,O1—M119类型的比例都小于0.5%,在陕西、山西、湖北等省,没有发现这种类型,出现频率为零,M119的分布呈现的是两头大中间少的格局。
O2—M95类型主要分布在东南亚地区,在泰国高达55%,从泰国向北在递减,从泰国向南也在递减,可以推论O2—M95变异最初出现在东南亚地区。在东亚地区,只在朝鲜人、日本人、阿穆尔人中有一定分布,在山东、河北、甘肃的汉族人群中,出现频率全部为零,找不到这种类型。
O3—M122类型是数量最多,分布最广的一种。从北亚向南到爪哇、新西兰,从日本向西到西藏、哈萨克人,全部能找到O3—M122的分布。出出现频率上看,O3—M122的出现频率最高地区为中国的云南地区、印度的那加邦土著民族上,很多民族中出现频率为100%,如独龙族等。在黄河流域的河北、陕西、山东,长江流域的湖北、安徽、四川、江西等地区的汉族人中,O3—M122都超过了80%。在北亚地区,O3—M122数量比较少,外蒙人中超过了30%,阿穆尔人也超过了40%,除这两个外其他都比较少,在艾温基人出现频率为零,在布里亚特人也为零,在日本人中为22%。在东南亚地区,只有泰国、柬埔寨等地区略少,其他地区一般超过50%,出现频率向南逐渐递减,到了爪哇人中出现频率只有20%,在汤加、新西兰的毛利人人也有出现,但比例都不大。
M175这三个子类型的地理分布告诉我们一个信息,我们可以推论出东亚各民族的发展史。
东亚黄种人开始可能分为四个大集团:北亚人群、黄河上游人群、黄河下游人群、中南半岛人群。
北亚人群代表了阿尔泰语系的民族,由于生活在气候寒冷地区,无法种植农作物,其他人群都不愿意涉足,所以很难取代他们。
黄河上游集团代表了古代汉藏语系民族(标志性基因O3—M122),黄河下游集团也是一个古老人群,他们特有的是O1—M119。大约在6~5千年前,古代汉藏语系先民开始分化,一支向西、向南发展,成为了藏缅语族、一支向东发展,并击败了黄河下游的古老居民,这些具有M119的民族开始分化为两支,北支进入了辽河流域,并深深影响了西伯利亚和北亚居民的基因构成,南支向南发展,成为后来的“百越”。
这段部族迁徙史,也许就是我们民间口口相传的著名的黄帝战胜蚩尤的历史传说!虽然我们找不到当年的战争遗迹,但我们完全可以找到吻合的考古和基因的证据:考古上,山东的大汶口文化从此消失了,取代它的正是从陕西河南来的龙山文化!在基因上,山东、河北的汉族人中M122和M119的比例接近200:1,超过99%人以上都是西来者(M122)的后代,而陕西、湖北的汉族人中干脆找不到M119的类型。
经过这次原始的部落战争,汉语族的各部族控制了整个黄河流域,他们建立了数量众多的方国,这种状态持续了大约近2000年。大概在距今3100年前,一支小部落从甘肃天水迁徙到了陕西周原,就是周族人。他们在周武王的带领下,周族人消灭了商朝。灭商后,周武王率领300辆战车和5000虎贲,用了三年时间,消灭了99个方国,征服了652个方国,俘虏了410万战俘《逸周书·世俘解第四十》。在此后的一百多年间,西周分封了大量诸侯国,周族也随着分封扩散到了全国。
周族人称自己国家是“有夏”,此后各诸侯国都自称“有夏”,对外统称自己“诸夏”,夏者,本意是区域广大。周族自称自己的本民族为“华”,称外族为“夷”,此后凡是与周族有同源关系的血亲部族都开始自称“华胄”“贵胄”,称外族为“非类”,意思是非华族类,华者,本意就是高贵壮丽。从此,“华夏”也就成了这些诸侯国的统称,这也是中华人民共和国中“中华”两字的来历。周族人的语言叫“雅语”(夏语),在全国通行,孔子讲学,学生来自不同的诸侯国,但孔子的话他们都听得懂,因为孔子说的是当时的普通话——“雅语”,这在《论语》里有:“子所雅言”的话,不说“雅语”就是被称为“野言”“非文”,由于有着交流需要和文学推进,“雅语”最终成为了全国通用的语言,也就是后来我们说的汉语。到了公元前221年,秦始皇最终将这些互相强烈认同的割据国家统一起来,后来又经过汉朝的统一和强盛,华夏族终于发展成为汉族。
先秦的发展,使得汉语族各支系语言全部统一到周族的“雅语”下,经过长期的融合,不断的人口迁徙,到今天,长江以北的汉族人,各地之间差异已经非常小了,从山东到甘肃,都没什么差异。
秦汉以后,中原王朝开始了对长江以南地区的军事和政治控制,大量的汉族移民开始迁往南方,今天,南北汉族在Y染色体上差异很小,90%的相似性,也就是南北方父系都是同源的。南北汉族的差异主要体现在mtDNA上,也就是母系上,简单的说,南方汉族基本可以表示为=父系(北方汉族Y染色体)+母系(北方汉族线粒体mtDNA+南方很多的民族的线粒体mtDNA),南方汉族不但和北方汉族在mtDNA上有差异,其实他们之间也不同,湖南的汉族和福建的汉族mtDNA就不同,甚至同是广东人,广府人和客家人在mtDNA上也不同。
怎么解释11亿南北汉族人在父系上全部同源而母系上差异明显呢?其实也很简单,看看1950s内地人迁往拉萨的情况,当时的规定,进藏只有部队团以上、地方正处以上的干部才可以带家属,那些年青战士和青年工人由于无法带家属,他们娶的都是当地的藏族女青年,造成了今天拉萨的汉藏混血儿青一色是父汉母藏。这在汉族南迁的历史也是类似的,迁往南方的汉族主要是由于服兵役、逃避战乱、因罪流放等因素,这些人基本都是男性,带家属的情况不多,所以他们肯定是娶了当地的女性,就造成了南方汉族有着和北方汉族相同的父系祖先,却有不同的母系。(其实总体来看,在南方,北方汉族母系的mtDNA还是占多数,也就是一半以上的南方汉族其母系也是来自中原地区的,但个别地区这个比例很少,南方当地女性的mtDNA部分地区可以达到85%)。
附件一东亚人群迁徙推论假说
附件二图,M214Y染色体的谱系树