东亚父系单倍群与语系的对应关系初探
标签:
语言学分子人类学历史文化杂谈 |
人类进入父系社会以后,由于男性在政治上的主导地位,加上女性基本都是从娘家嫁入男性家庭,因而语言存在明显的“从父居”现象。寻找语言与父系单倍群之间的潜在关系,可以为我们在民族或王朝的单倍群研究中指明一个基本方向。美国圣塔菲研究所的Murray Gell-Mann和斯塔福大学的Merritt Ruhlen在已故的著名语言学家谢尔盖·斯塔罗斯金和约瑟夫·H·格林伯格的研究基础上,构建了世界语言的谱系。
O*最高频的高栏人、白仡佬、杞黎、普标人和南部壮族都说壮侗语②,O系频率高达96.4%的台湾原住民说南岛语,而Jean A. Trejaut在台湾邵族16例男性样本中测得100%的O1a-M119③。壮侗语与O1b2-M95相关性比较大,南岛语与O2-N6-B451、部分M119支系(如F140(×F78))有关。Murray Gell-Mann 和Merritt Ruhlen将南岛语和壮侗语合并为澳泰语系,推测澳泰语系可能与O1关系密切。与中国语言学家的划分不同,Murray Gell-Mann和Merritt Ruhlen将澳泰语系与苗瑶语、南亚语系再次归并,形成南方大语系①。苗瑶语至少会与O2-M7这一支系有相关性,总体来说,可以合理推测O系与南方大语系有关,这与长期以来从O系多样性数据统计得出的O系南方起源的结论是一致的。
法国语言学家沙加尔认为汉语与南岛语同源,并据此提出汉南语系假说。郑张尚芳先生也支持汉语与南岛语同源的论证,并认为汉语、藏缅语、侗台语、苗瑶语、南亚语和南岛语可以组成了一个超级语系——华澳语系。汉语与南岛语的同源关系体现了汉族中占绝大多数的O系对汉语的影响,O系可以与假说中的华澳语系和汉南语系对应,这种语言的最初风貌可能接近台湾原住民的语言。如果炎帝和蚩尤没有被黄帝打败,中国人现在说的语言或许接近原始南岛语。
南岛语系的起源地在哪里?中外学者的观点中对于南岛语系的源头支持率最高的是台湾。初步推测,从台湾出发的M119和B451南迁到了菲律宾,其中M119向西南方向迁徙到印度尼西亚、马来西亚直至非洲的马达加斯加岛,B451向东南方向迁徙到美拉尼西亚、波利尼西亚直至新西兰。台湾原住民更早以前应是自中国大陆迁徙而来,福建省闽江畔的昙石山遗址给出了南岛语族最早源头的考古证据。考古界倾向认为,中国东南沿海是南岛语族先民走向茫茫海洋之前在亚欧大陆的最后一片栖息地。如果继续追根溯源,南岛语族先民的祖先迁徙路线可上溯至江西、湖南直到广西,那里才是O系最早的起源地。
南岛语在现代汉语中仍然有诸多遗存,它往往代表了汉语的底层、俚语或白话文。譬如,脑袋在湘鄂川渝等地称“脑壳”,实际源自南岛语nuq。上古汉语的稻也源自侗台语和南岛语。除了南岛语系采用VSO语序外,其它南方大语系都采用SVO语序,这与现代汉语占主导的主谓宾语序相同。南岛语系的VSO语序应出自晚期语言的进化。与汉语形容词和中心名词之间采用AN语序不同,南岛语系采用NA语序。这种语序在汉语中也仍有部分遗留,比如重庆名菜烧鸡公实为烧公鸡,月亮本为亮月,腐乳意为乳腐。南岛语在中国南方方言中遗留得似乎更多一些,或许与南岛语起源于南方有关。
二、Q系与汉-高加索语系或德内-高加索大语系
汉-高加索语系由俄罗斯著名语言学家谢尔盖·斯塔罗斯金在上世纪80年代提出,它涵盖了高加索语系、叶尼塞语系和汉藏语系。1991年谢尔盖·L·尼古拉耶夫将北美印第安人的纳-德内语加入了斯塔罗斯金的这一语系中。1996年,美国的约翰·D·本特森在汉-高加索语系的基础上添加了瓦斯科尼语(包括巴斯克语,巴斯克语已灭绝的亲戚或祖先阿基坦语,可能还有伊比利亚语),并在1997年将布鲁夏斯基语也包括在内,提出了德内-高加索语系假说。同年,本特森在为母语撰写的文章中得出结论,苏美尔语可能是德内-高加索语系中一个独特亚群的残余。
没有哪一种语系不受质疑,包括华澳语系、澳泰语系甚至汉藏语系,德内-高加索语系假说也不例外。德内-高加索语系下的各语系虽然都分布于北半球,但地理上并不连贯且相距遥远。如果将德内-高加索语系与父系单倍群联系,我们发现一个若隐若现的共同点——它们都与Q系有关。操叶尼塞语的Ket人是欧亚大陆Q系最高频的族群,他们的父系主要是Q1b-L54。操纳-德内语的北美印第安人Q系(主要是Q1b-M3和Q1b-CTS1780)频率为全球各族群中最高。操北高加索语的北奥塞提人和车臣人自称是古代阿兰人的后裔,而北奥塞提6世纪至9世纪间的一处古阿兰人的墓地成功提出的两例古DNA都是Q1b,其中一例为Q1b-L53,另外一例为Q1b-CTS4565。布鲁夏斯基语分布于巴控克什米尔北部,理论上也应与Q系有关。青铜时代的乌兹别克斯坦和青铜时代晚期至铁器时代的巴基斯坦已发现多例Q2b古DNA,考虑到印度和巴基斯坦的Q系主要是Q2b-L68.2,克什米尔的布鲁夏斯基语或许指向的是Q2b。Q系的共祖时间是3万年左右,落在Murray Gell-Mann和Merritt Ruhlen给出的德内-高加索语系的诞生时间(距今4万至2万年)内,这不应该仅仅只是一个巧合。由此,我们也可以从德内-高加索语系与汉藏语系的亲缘关系推测汉藏语系的起源可能与某支Q系人群有关。至于本特森提出将巴斯克语和苏美尔语也归入德内-高加索语系,我目前没有找到这两种语言与Q系有关的确凿证据,对此我心存疑惑。
汉-高加索语系或德内-高加索大语系可能与汉语的雅言、夏言或文言文有关,代表了汉语的表层,比如“犬”可能与古印欧语有关④,而“狗”与南岛语有关⑤。德内-高加索大语系主要采用SOV/AN语序,这与现代汉语占主导地位的主谓宾结构不同。很多历史语言学家都认为汉语早期采用的是SOV语序,这在古文中的否定句和疑问句中遗留甚多,如“莫我肯顾”、“何陋之有”、“吾谁与归”、“诚不我欺”等。现代汉语的一些成语在否定和“唯...是...”句式中还遗存有SOV语序,如时不我待、唯利是图、唯命是从等等。现代的藏缅语族也还采用SOV/AN语序,而上古汉语的SOV语序逐渐转向SVO语序为主可能与O系在政治地位上的回归有关,这一转变大概发生在周朝前后。O系的SVO语序更符合人类的思维方式,英语、法语、德语和俄语等印欧语系也都采用这种语序。
滇西北藏缅语族中的独龙族拥有100%的M122父系,但这并不能作为汉藏语系的起源与O系有关的证据。独龙族的祖先应是沿横断天路自甘南地区南下的古羌人,他们在甘肃接受了华夏集团的原始汉藏语。然而,这种原始汉藏语与O系最初所说的原始南岛语并不相同。
三、C2系与阿尔泰语系
阿尔泰语系主要分布于中国的长城以北至西伯利亚地区、中亚和西亚,包括突厥语系、蒙古语系和通古斯语系。成吉思汗大概在C2北-F3796(旧称C3*)的下游,而哈萨克斯坦中部一处金帐汗国时期的墓地中的古DNA样本DA28测得是C2北-F3796的下游F5481,他是一名信奉佛教(喇嘛教)的蒙古战士。由此可以推测,C2北-F3796很可能与蒙古语系有关。也有观点认为成吉思汗可能是C2北-F1756,而元威的古DNA测得F1756,宇文邕也测得C2,因此一般认为鲜卑与F1756有关。有机构研究认为爱新觉罗家族位于C2北-F10283的下游,C2北-F10283可能与通古斯语系有关。另外,C2北-M86下的F5484也被认为可能与通古斯人群有关。不难看出,阿尔泰语系与C2北有强烈的相关性。
追溯蒙古语族和通古斯语族的上古族群,他们都应与东胡有关。拓跋氏和宇文氏出自鲜卑,蒙古族出自室韦,而鲜卑和室韦都出自东胡。柔然与北魏皇室的血缘关系密切,《魏书》亦载柔然为“东胡之苗裔”。内蒙古和蒙古国的早期东胡、鲜卑、柔然和室韦的古DNA都测得有C2北-F3918。可以认为,C2北是东胡父系的主要组成部分,而东胡人可能说的是一种原始阿尔泰语。操通古斯语的满族出自肃慎,与东胡为邻。
突厥人是六世纪以后在蒙古高原和中亚草原崛起的一支游牧民族,他们建立了强大的突厥帝国,并将突厥语衍布到了中亚和西亚的大部分地区。考虑到突厥语系属于阿尔泰语系,阿史那氏或许与C2北有关。C2南由于主要分布于中原地区东部,很早以前可能被人口更多的O系同化,使得他们原来的语言消弭不显了。根据C2南与C2北的父系亲缘关系,不排除在O系未涌入中国北方之前C2南也说一种原始的阿尔泰语。与德内-高加索语系相同,阿尔泰语系也采用SOV/AN语序,这代表了除南方大语系外亚洲地区普遍使用的一种古老语序。
D系原初语系的研究可资借助的素材太少,故不单独列一节讨论。关于原始D系语言的语序,我推测也应是SOV/AN语序。SOV语序是人类最古老使用最多的语序,而SVO和VSO都是从SOV进化而来。考虑到D和C系都是最早进入东亚地区的晚期智人,可以假定D系原始的语言可能略与C系接近。
四、N系与乌拉尔语系
乌拉尔语系分布于斯堪的纳维亚、乌拉尔山脉和亚洲西北部等广大地区,包括芬兰-乌戈尔语族、萨莫耶德语族和尤卡吉尔语族。芬兰-乌戈尔语族的芬兰人N系的频率高达58.5%,他们几乎是欧洲N系最高频的民族。同样说芬兰-乌戈尔语的立陶宛人的N系频率高达42%,而操萨莫耶德语的涅涅茨人(Nenets)N系的频率更是高达95%。我没有找到尤卡吉尔人的N系频率,有观点认为尤卡吉尔人实际出自雅库特人,而雅库特人的N系频率高达90%。以上的事实让我们有理由相信,N系的语言可以与乌拉尔语系对应。
阿瓦尔人6世纪下半叶以匈牙利平原为中心建立帝国,6世纪末达到极盛时期,公元805年被查理曼大帝征服。阿瓦尔时期匈牙利境内14例古DNA中7例是N1a⑥,这揭示了征服者阿瓦尔人的主要父系构成。一例匈牙利十世纪的古DNA测得N1a,他可能与马扎尔人有关⑦。留里克王朝DNA项目中确定了立陶宛的格迪米纳斯王朝的单倍群是N1a,而格迪米纳斯家族另一个分支在1471年到1526年间也统治过匈牙利。匈牙利地区多次被N1a单倍群的王权统治,这或许为我们解答匈牙利语为何属芬兰-乌戈尔语族找到了答案。
乌拉尔语系中采用SOV和SVO语序的都有,SVO语序略多。我未查询到乌拉尔语系的AN/NA语序,推测是AN,它代表了欧亚大陆北部地区普遍采用的一种形容词和中心名词语序。根据N南与N北的父系亲缘关系,不妨假设中国境内的N南支早期也说的是一种原始乌拉尔语。虽然N系也是南方起源,并在中国北方经历了一次早期的成功爆发,但他在汉族中的人口尚未超过C系甚至未超过C2南支。研究汉藏语系的语言学家主要将汉藏语系与叶尼塞语、北高加索语、纳-德内语、印欧语和南岛语等联系,这其中不包括乌拉尔语。在Murray Gell-Mann和Merritt Ruhlen给出的语系进化树中,汉藏语系与乌拉尔语系在6万至4万年前就已分开,两者的关系堪称渺茫和疏远。汉藏语系与美洲大陆的纳-德内语尚且能建立联系,而与同一亚欧大陆上距离更近的乌拉尔语系却没有关系。因此,可以合理推测,汉藏语系的起源与N系的关系不大。
五、东亚语言的混合
一个族群一般不会轻易改变祖先的语言,除非存在强大的外来力量促使他们不得不转变。在语言需要改变的时候,它的走向一般朝着具有更高经济地位、更多政治权力和更高声望的群体方向流动。这种外来的转变力量可能伴随着武力、歧视、压迫甚至奴役,历史从来都不是温情脉脉的。因此,一个民族的语言总是会体现组成该民族的主要父系和在语言发端时期占统治地位的父系的影响。
不可否认,汉语是一种混合语言。我们发现,藏缅语、北高加索语、叶尼塞语、印欧语和南岛语与汉语都存在同源关系。北高加索语、叶尼塞语和南岛语代表了汉语的源,前两者与Q系有关,而南岛语起源体现了汉族中占多数的O系人群的影响。印欧语与汉语的同源性代表了Q系亲属父系R系对汉语的间接影响。与汉语同源度最高的藏缅语代表了原始汉语的流,在接受了Q系语言影响后,西北古羌人将华夏语带到了西藏和缅甸。由此可知,在华夏文明初创时期,Q系可能具备较高的政治地位。汉语早期的SOV语序与现在主流的SVO语序不同,暗示了后期O系人群政治地位的提高。汉语AN语序与南岛语不同,体现了北方人群对汉语的长期影响。在中国北方经历过华夏文明洗礼和被动转变语言后的O系人群,迁徙到长江流域、两广和藏缅后,他们的文明程度显著高于那里的土著荆蛮和百越,语言也差别巨大。出自东夷的O系楚人接受了华夏文明,来到南方后已听不懂用O系语言表达的《越人歌》了。在西北接受了华夏语后南下的独龙族虽然拥有100%的M122,但据此推证汉藏语系是M122带来的显然证据不足。
日语的起源一直是个争论不休的问题。明治时代的日本人认为日语属于阿尔泰语系,但这一说法已被普遍否定。后来的语言学家做过更多尝试,将日语归入了达罗毗荼语系、汉藏语系、高句丽语系(扶余语系)等语系。也有学者认为日语和琉球语言可以组成日本语系,或者,将南岛语系、壮侗语族和日本语系组成所谓的南岛-台语系。如果从日本人的祖先迁徙路线和他们的父系单倍群角度分析,这个问题就迎刃而解了。日语也是一种混合语,这是日语长期以来无法准确分类的原因。日本著名人类学家鸟居龙藏在《史前的日本》中提出日本文化复合论观点,将虾夷(阿依努人)、北方系日本人、印度尼西亚族、印度支那族视为构成日本民族的几大要素,这与单倍群上观察到的父系融合现象是不谋而合的。其中印度支那族指的是汉族进入华南以前的苗族,他们的铜铎、稻米、麻草鞋、木屐、横穴墓、杆栏建筑等文化特征也在日本出现⑧。南岛-台语系的建议以及苗族与日本文化的共同之处,体现的正是日本民族中O系(O1b2)的影响。将日语与阿尔泰语系联系,也并非完全没有价值。阿尔泰语系对日语的影响,体现了日本民族中O系的祖先迁徙轨迹,他们可能早期出自居住于辽东半岛的濊貊族群。夏朝至三国时期,我国东北地区分布着三大族群:肃慎、濊貊和东胡,其中肃慎和东胡的父系以C2北为主,濊貊则以O系(多数可能是O1b2)为主。居住于东北南部地区和汉四郡故地的是濊貊,他的西边是东胡,北边是肃慎。由于长期与这两个以C2北为主体的族群接壤和交融,濊貊人的语言不可避免地受到阿尔泰语系的影响。语言上的痕迹串起了日本民族中的O系与朝鲜半岛、辽东半岛和苗族之间的联系,O1b2应是一两万年前自湘桂黔地区北上,4000多年前才离开胶东半岛走渤海海峡登陆辽东半岛的,而泰沂山脉南麓可能是完善这条迁徙路线的重要节点。由于离开鲁西地区较早,濊貊人基本没有接受华夏文明,因而汉藏语系对日语和朝鲜语的影响甚微。日语与汉藏语系的关系主要表现为汉音和吴音等音读带来的汉语外来借词。扶余人和高句丽人都应是出自濊貊,扶余语系的提法可能是几种观点中相对最接近日语本源的。然而,O系对日语的影响终究有限。日语采用的是SOV/AN语序,似乎日本的O系完全放弃了他们原有的SVO/NA语序,这体现的应是在日本民族中占三分一的土著D系人群的影响。SOV语序是人类语言最初的语序,而AN语序与欧亚大陆北部人群有关。有研究表明东山天皇的单倍群不是O1b2而是D1b,这应是情理之中的事,因为语言的转变总朝着统治者的方向流动。朝鲜语的情况与日语类似,也可以划入扶余语系。它也采用SOV/AN语序,可能也是受东北的C2北和北方人群的影响。
青藏高原毗邻华夏文明的起源地,汉藏分离后的古羌人与土著的D系融合,形成了藏缅语族。藏缅语保留了早期华夏语的SOV/AN语序,其中的缘由可能是D系原有的语言也是SOV/AN语序,使得古羌人的SOV/AN语序得到了进一步强化而固定下来。虽然藏语保留了更多早期汉语的特点,但藏缅语可能也是一种轻度的混合语言,它与汉语的差异可以认为是D系的影响所致。
通古斯语系似乎混合的程度不高,可能保持了较多C2北语言的原貌。蒙古语系早期是否受到N系和Q系的影响,还需要研究。突厥人中由于融入了很多C系、Q系、N系和R系人群,突厥语更可能是一种混合语言。自20世纪60年代起,语言学术界内普遍开始否定阿尔泰语系,认为他们之间的关联源自相互接触而非同源。这将加大突厥语起源和突厥可汗单倍群的研究难度。
“因爲遺傳上某幾個族羣的Y染色體有一致的,因此這兩種語言具有親屬關係”本是合乎逻辑并具有启发意义的研究思路,但在某些人的眼中却是完全错误的。在这些人眼中,某個族羣中幾大超級父系之首的Y染色體肯定是該族羣語言的創造者,卻是無比正確的。按照这一通俗易懂的原理,匈牙利语应该是人口频率最高的R1a创造的,但为什么匈牙利语不属于印欧语系?科学作为人类探索未知世界的强大工具,某些人不是用于发现真相和追求真理,而是用于强化和证实自己的偏见。
参考文献:
① Murray Gell-Manna、Merritt Ruhlenb,《The origin and evolution of
word order》
② 李辉、文波等,《Paternal genetic affinity between western Austronesians and Daic Populations》,BMC Evolutionary Biology,2008年5月;
③ Jean A.Trejaut等,《Genetic diversity of the Thao people of Taiwan using Y-chromosome mitochondrial DNA and HLA gene systems》,BMC Evolutionary Biology,2019年12月;
④ 周及徐,《汉语和印欧语史前关系的证据之一:基本词汇的对应》,四川师范大学学报(社会科学版),2003年11月;
⑤ 邢公畹,《关于汉语南岛语的发生学关系问题》,民族语文,1991年第3期;
⑥Endre Neparáczki等,《Y-chromosome haplogroups from Hun,Avar and conquering Hungarian period nomadic people of the Carpathian Basin》,Scientific Reports,2019年11月;
⑦ B.Csányi等,《Y‐Chromosome Analysis of Ancient Hungarian and Two Modern Hungarian‐Speaking Populations from the Carpathian Basin》,Annals of Human Genetics,2008年3月;
⑧ 杨志强、罗婷,《20世纪初鸟居龙藏在中国西南地区的人类学调查及其影响》,民族研究,2016年第6期。

加载中…