中国北方人被查出有5%的人祖源是美洲土著血统!基因检测到底是啥?

标签:
杂谈教育文化时评图片 |
分类: 历史、故事 |
全世界关心的三个问题为大家热身,它们的答案藏在文章里:
如果你希望获得别处没有的信息,这一定是你能看到的最全的祖源知识通关攻略,配合祖源分析报告食用,佐以中国历史,你会发现基因测祖源远比「晒外国血统」更有趣。
首先要告诉大家,各色 DNA 的祖源检测结果不久前升级了,祖源部分由原本的 14 个地区,细分了成全世界 59 个地区和族群。
新版的祖源检测报告长这样
1、我的祖源结果是怎么得出来的?
我发现人们对祖源检测存在一个误解:“祖源测的就是我祖先曾经所在的地方。”
其实并不是,祖源分析的参考数据都是连续几代生活在这个地方的现代人。
拿北方汉族来说,当我们找到足够多长期生活在北方汉族地区的人,我们就构建了一个北方汉族地区的参考数据库。
2016 年,当我刚开始做中国人祖源解读的时候,我发现,几乎没有中国不同地域的基因参考数据库。
即使在全球用户量最大的 23andMe(目前可以探测全球 150 个国家和地区的祖源),中国人也只是被粗略划分为南方人和北方人。
一个典型的中国人在23andme的祖源成分检测结果
在我们去年9月份发布第一版祖源解读的时候,我们积累了第一版中国人族群数据库。
我们将生活在中国的人分成了 6 个地区,将国外人口分成了8个地区。据此给出了每个人的比例解读,并且邀请大家继续参与家庭出生地的调查。
今年,我们有了更大更丰富的族群数据库。升级之后,各色的祖源由原来 14 个地区,升级为 59 类,主要是源自于祖源参考数据集的优化。
我们积累的参考数据库包括有:
由数万名各色用户贡献的 DNA 数据
国际千人基因组计划中的公开数据
斯坦福大学人类基因组多样性研究计划中的公开数据
由于各色用户绝大部分是中国人,因此在收集和整理国外不同族群的参考数据时,我们仍然重点分析中国人的数据,特别是汉族群体。
2、测出来的“外国血统”,到底怎么理解?
我看到很多人会乐于在社交网络上分享自己的「5% 美洲土著基因」,这听上去很酷。它的科学解释是:祖源成分并不代表你一定有这里的祖先,而是你的祖先有 5% 的可能是这里人。
人有 23 对染色体,22 对常染色体,1 对性染色体(女性是 XX,男性是 XY )。做祖源成分分析使用的是 22 对常染色体数据。
人类基因组中,大约 99.9% 的 DNA
比如,影响人是否有腋臭的基因位点是 rs17822931,这个点基因型为 C 的人,体味更重一些。
rs17822931 在世界不同地区的分布差异很大,在非洲有 99% 的人携带 C ,在美洲和欧洲携带 C 的比例是 86%。
而在东亚携带 C 的比例只有 22%,大部分人东亚人在这个位点是 T型,表现为干燥的耳垢和更轻的体味。
如果一个人 rs17822931 检测结果为 TT,从概率上来讲,他更可能是一个东亚人。
rs17822931
所以,当我们找到足够多像 rs17822931 这样的基因位点,即在不同地区,不同人群中基因位点类型频率分布有差异的位点, 我们就可以去推测你的祖源成分。
位点1(C)
位点2(A)
位点3(G)
祖源参考数据集示例
计算祖源成分的算法上,我们使用的是美国加利福尼亚大学洛杉矶分校相关人员研发的,也是目前使用比较广泛的专门计算祖源成分的方法—— ADMIXTURE(http://software.genetics.ucla.edu/admixture/)。
其核心算法是极大似然估计法(Maximum Likelihood Estimate,MLE),简单说就是通过你的基因数据,计算出你最可能由哪几种族群组成,以及相对应的百分比。
所以,如果改变祖源地区的划分类别,检测结果就会发生变化。
3 :你的基因中藏了哪些地域的秘密?
各色的祖源主要是以地域而非民族为划分标准的。因为,大部分中国人是北方汉族或南方汉族主体,如果用民族来做祖源划分,一个汉族人的祖源结果会比较「无聊」。
其实,除了民族之外,基因中还蕴藏着非常丰富的地域差异信息。
今年新发表的一项大规模中国人祖源研究,根据 19 个省和直辖市 共 11670 名汉族人的分析发现:
北方省市中,甘肃、陕西和山西,与其他省市(东北三省、山东和河南等)有差异。
相比北方汉族呈现出来的东西差异,南方汉族则呈现南北差异,即长江流域(江苏、安徽、湖北、浙江等)和东南沿海(湖南、福建和广东)存在差异。
各色选择 3620 个代表用户,得到了跟上面这个研究类似的结果:
当地各色汉族用户较少的国内省市和自治区未包含,图中的分类「中国」为用户填写的原始数据
这张结构图可能看上去有点费解,你记住这几点就好了:
中国汉族可以分为南北两部分,南方汉族和北方汉族。
北方汉族中,甘肃与吉林省和其他省市存在差异,这可能是因为甘肃与新疆和内蒙相连,长期的民族融合交流会影响汉族的特异性;而吉林省满族人聚居,且东临朝鲜半岛。
天津市明显区别北方汉族的表现,让我们有些费解。希望有更多天津土著参与我们的检测,期待未来我们可以一起破解这一谜题。
南方的划分中,贵州省、重庆市和云南省与其他地区存在差异。其他地区可以分为长江以南和东南沿海两大部分。
根据层次聚类和 PCA 分析结果,我们选择了区域而非民族(南方汉族和北方汉族)来给大家进行祖源成分划分。
中国历史上多次人口迁徙和民族融合,比如四川省与湖北、江西和浙江等省市比较类似,我们都将其定义为「长江以南」地区。这也呼应了清朝初期「两广填四川」的人口迁移史。
北方中部
你的祖先是最早的「华夏儿女」。根据《史记》记载,黄帝与炎帝的战争即发生在今天河北山西一带,
历史上频繁的战乱也带来了西北少数民族的融合和迁徙。你们爱吃面食和酸辣口味,通常有高大强壮的体魄。
北方蒙古人种|河北|山西|陕西|脸长且平|鼻高|单眼皮更多|关羽|张艺谋|郭晶晶|面食
北方东部
你的祖先分布在黄河中下游地区和华北平原,在两千多年的时间里,原本居住在此地区的汉族不断向外扩张,并和别的民族融合。
北方蒙古人种|山东|河南|高大|长方脸|鼻梁高|深眼窝|黄渤|孔丘|面食|鲜香|生食葱姜
长江以南
2000 多年前,北方汉族和汉文化逐渐南下,改变南方原住民的遗传结构。你可能是北方民族南下后,与侗傣、苗瑶等南方原住民族共同繁衍的后代。相比北方汉族,南方汉族基因的内部差异更大。
南方蒙古人种|浙江|江西|湖北|四川|安徽南部|脸较阔|肩膀窄|躯干长|大米|咸粽子|甜豆腐脑
东南沿海
中国历史上有数次人口南迁,在漫长的民族融合过程中,你的祖先选择定居沿海。沿海人民坐拥海洋宝库。丰富的海洋资源,频繁对外交流的港口都让你的祖先从古时候就享受到繁荣的经济。
南方蒙古人种|广东|福建|湖南|约2.1 亿|鼻子较宽|鼻尖上翘|身高中等|粤方言|闽方言|客家方言|沿海地区口味清淡|内陆嗜辣人
各色汉族分类
4 :怎么理解报告中的祖源百分比?
如下图,我出生在山东,我有 34.44% 的北方东部成分。这个数字的科学解释是,我来源于北方东部人的可能性是 34.44%。
我们把你 DNA 数据中的大量基因位点,和祖源参考数据进行比对,得到了你的综合预测结果。即你来源于这个族群的概率。
5 :少数民族的参考数据库是怎么来的?
我们用户中数量比较多的少数民族,如藏族、新疆地区少数民族,以及西南少数民族,都使用用各色用户数据作为参考数据库。
但由于其他少数民族的用户数量较少,我们参考了国外的公开数据库。
达斡尔族
你的祖先骁勇善战,自明清以来为捍卫疆土披甲守边,是中国境内最接近契丹人后裔的族群。
蒙古人种|直发|有内眦褶|铲形门齿|约 13 万人|达斡尔语|萨满教|藏传佛教|柳蒿芽|曲棍球
傣族
你的祖先们可能来自川北陕南地区,因战乱不断向南迁移,随后在云南、东南亚等地定居发展。也有学者认为你的祖先们原本就定居自红河以西到伊洛瓦底江上游,是该区域的原住民。
蒙古人种|泰国|缅甸|中国云南省西双版纳|普洱|1500-2000 万人|男性多用白布或青部包头|女性大多束发|汉藏语系壮侗语族壮傣语支|傣语|西双版纳傣文|菠萝饭|竹筒饭|俸正杰|毛相|兰昊宇
锡伯族
你的祖先可能是中国古代鲜卑人或者女真人的后裔,你们主要分布在中国东北,还有一部分在新疆。你们注重礼节,锡伯族西迁的历史壮举也一直被铭记。
辽宁|新疆|锡伯语|阿尔泰语系通古斯语族满语支|190481人|萨满教|喇嘛教|抹黑节|西迁节|注重礼节|锡伯大饼|全羊席
鄂伦春族
17 世纪以前,你的祖先生活在黑龙江以北,贝加尔湖以东直至库页岛的广阔土地上。游猎是他们的生活方式。17 世纪,部分鄂伦春人南迁到大小兴安岭地区。你的祖先们能歌善舞,勇敢擅猎,被誉为「兴安岭上的猎神」。
北方蒙古人种|黑龙江|内蒙古|8659人|高鼻梁|小眼睛|大耳多|尖下巴|萨满教|兽肉|米|面|五味子汤|桦树汁
赫哲族
赫哲,意为居住在「东方」及江「下游」的人们。你的祖先传说是女真部落的一支,在严寒地带狩猎,捕鱼和歌唱。每两年一次的乌日贡节是你们的盛会。
通古斯人种|赫哲语|阿尔泰语系满-通古斯语族满语支|5354人|萨满教|中国黑龙江|俄罗斯|渔猎民族|吃生鱼|鱼皮部落|传统赫哲族衣服都用鹿皮和鱼皮制作|乌日贡节|乌苏里船歌|伊玛堪说唱|德苏·乌札拉|韩庚
畲族
畲,意为“刀耕火种”,是东南沿海主要的少数民族。祭祖是你们最隆重、最普遍的信仰习俗活动。重视文化传承,淳朴热情和勇于开拓一直流淌在你们的血液中。
福建|浙江|散居民族|女性头佩“三把刀”习俗|喜爱武术|710039人|第十九大少数民族|畲话|汉藏语系苗瑶语族|万物有灵|佛教|双条落|三月三
藏族
4000 多年前,你的祖先曾在西藏雅鲁藏布江中游两岸聚居,他们是世界上最早占据高海拔地区的现代人。
北方蒙古人种|西藏|青海|甘肃|四川|鼻子窄|脸型平|胸围大|松赞干布|仓央嘉措|万玛才旦|牛羊肉|青稞酒
新疆少数民族
你的祖先们可能经过中亚,那里的人们从未停止过迁徙和交流,在史前就可能与其他人种融合。 你的祖先可能与东欧和西欧有着相似的人体体质学和遗传学特征。维吾尔族和哈萨克族是新疆少数民族的主体。
高加索人种和蒙古人种的融合|新疆|亚欧混合|阿曼尼莎汗|塞努拜尔·吐尔逊|马木尔|馕|砖茶|奶茶|手抓饭|奶疙瘩
蒙古少数民族
美丽的额尔古纳河孕育了你的祖先。你的祖先们是马背上的王者,他们征服的脚步横扫整个大陆。他们曾经占有世界上 1/4 的陆地,西起多瑙河,东至黑龙江,都曾是他们放马的牧场。
北亚人种|成吉思汗|忽必烈|腾格尔|白岩松|1000 万人|黄皮肤|高颧骨|鼻根低|扁宽脸|蒙古褶|汉语|蒙古语| 萨满教|藏传佛教|牛羊肉|奶制品|内蒙古|新疆|东北|河北|蒙古国|俄罗斯|
西南少数民族
东临中南,北依西北,人口最稠密、交通最便捷、经济最发达——你的祖先曾在这里欢歌、农耕。他们有自己的语言、自己的信仰、自己的仪式,男耕女织、黄发垂髫,人人欢声笑语、自给自足。你的根就在这片世外桃源之中。
南方蒙古人种|四川|云南|贵州|椭圆脸|直眉|重睑|鼻梁直|正唇|嘴唇中等厚|宋祖英|杨丽萍|食材多样|口味多样
各色少数民族分类
最后,我想自曝一下我们的“bug”:
由于这一版的局限性,参考数据集并未涵盖世界上所有的祖源成分。比如我们并未包含法国人的参考数据,所以会输出的结果是英国人和西班牙等法国临近地区的祖源成分结果。
这可能会让一个法国用户感到困惑。