加载中…
个人资料
polyhedron
polyhedron 新浪个人认证
  • 博客等级:
  • 博客积分:0
  • 博客访问:507,376
  • 关注人气:1,464
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

人類學雜記——26. 漢族按方言區的Y染色體分佈

(2013-12-13 16:01:40)
标签:

y染色體

方言

聚類

主成分分析

分子人類學

分类: 人類學雜記
因爲一直有人問我,我採的樣本如果不按省、市等行政單位劃分,而按方言劃分,方言之閒的Y染色體是否會表現出一些分佈上的特徵。於是我頗費了一番勁兒統計了一下。

人類學雜記——26. <wbr>漢族按方言區的Y染色體分佈

需要說明的是,方言定得不是都很準(總體來說,如果是對方言敏感的地區,比如蘇南、廣東,或者我專門去採的湖南等地,方言記錄應該是精確的,但比如北方的一些地區,方言採樣時沒有專門記,就只是按籍貫地所屬方言大致算了一下。表中每一行的樣本數最少25個,最多幾百個。樣本量太少的平話、徽語、蘭銀官話等沒放在表裏。另外,樣本均按非同宗樣本統計(即同鄉同姓STR也極近的,只按一個樣本統計)。對樣本的均一性沒有保證,比如贛語有很多湖南的之類,未必以江西爲主。

鑑於很多人對漢方言的分類不是很清楚,補充一個自製的方言區劃圖(不準確,湊和看吧):
人類學雜記——26. <wbr>漢族按方言區的Y染色體分佈
其中紅色邊界是漢語十大方言的邊界(官、吳、粵、閩、湘、晉、客、贛、平、徽),藍色爲官話內部的方言區的邊界。


以下分析僅供參攷,不宜過度解釋。

這是用以上頻率做的Y染色體主成分分析的第一主成分(35.9%)和第二主成分(22.3%)的散點圖:
人類學雜記——26. <wbr>漢族按方言區的Y染色體分佈

我就不多講了,因爲這種主成分分析圖會隨羣體的選取,在圖上的點的相對關係會發生明顯變化(比如多加個土家族或滿族,就可能有很大變化了)。

下面是做的若干種聚類(clustering)及鄰接法(neighbor-joining, NJ)法做的樹,也只是作個很麤略的參攷。我的看法仍然是:對於有大量混合的情況(不論羣體的Y染色體,還是個人的常染色體等,或方言之閒),只要不是確有很嚴格的樹形分化歷史,而是有大量混合發生的网狀結構的歷史,用樹形來表示演化關係必然是片面、也是不穩定的。所以如果問我,我相信下面哪棵樹的拓撲形狀?我哪個都不信,放這些樹就是爲了告訴大家不要信這些樹。只有像用個人序列畫的Y染色體和線粒體這樣的樹纔是有歷史原型的眞實且穩定的樹。

NJ樹,correlation(手工設閩語爲根):
人類學雜記——26. <wbr>漢族按方言區的Y染色體分佈

NJ樹,Euclidean(手工設閩語爲根):
人類學雜記——26. <wbr>漢族按方言區的Y染色體分佈

NJ樹,Rho(手工設閩語爲根):
人類學雜記——26. <wbr>漢族按方言區的Y染色體分佈

Cluster, Correlation
人類學雜記——26. <wbr>漢族按方言區的Y染色體分佈

Cluster, Euclidean:
人類學雜記——26. <wbr>漢族按方言區的Y染色體分佈

本人是統計小白,歡迎給我推薦更有意義的分析方法。


首發於2013.12.13,新浪博客
修改於2013.12.19

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有