[转载]人類學雜記——26. 漢族按方言區的Y染色體分佈

标签:
转载 |
随便看看
王小东
王小东
因爲一直有人問我,我採的樣本如果不按省、市等行政單位劃分,而按方言劃分,方言之閒的Y染色體是否會表現出一些分佈上的特徵。於是我頗費了一番勁兒統計了一下。
需要說明的是,方言定得不是都很準(總體來說,如果是對方言敏感的地區,比如蘇南、廣東,或者我專門去採的湖南等地,方言記錄應該是精確的,但比如北方的一些地區,方言採樣時沒有專門記,就只是按籍貫地所屬方言大致算了一下。表中每一行的樣本數最少25個,最多幾百個。樣本量太少的平話、徽語、蘭銀官話等沒放在表裏。另外,樣本均按非同宗樣本統計(即同鄉同姓STR也極近的,只按一個樣本統計)。對樣本的均一性沒有保證,比如贛語有很多湖南的之類,未必以江西爲主。
以下分析僅供參攷,不宜過度解釋。
這是用以上頻率做的Y染色體主成分分析的第一主成分(35.9%)和第二主成分(22.3%)的散點圖:
我就不多講了,因爲這種主成分分析圖會隨羣體的選取,在圖上的點的相對關係會發生明顯變化(比如多加個土家族或滿族,就可能有很大變化了)。
下面是做的若干種聚類(clustering)及鄰接法(neighbor-joining,
NJ)法做的樹,也只是作個很麤略的參攷。我的看法仍然是:對於有大量混合的情況(不論羣體的Y染色體,還是個人的常染色體等,或方言之閒),只要不是確有很嚴格的樹形分化歷史,而是有大量混合發生的网狀結構的歷史,用樹形來表示演化關係必然是片面、也是不穩定的。所以如果問我,我相信下面哪棵樹的拓撲形狀?我哪個都不信,放這些樹就是爲了告訴大家不要信這些樹。只有像用個人序列畫的Y染色體和線粒體這樣的樹纔是有歷史原型的眞實且穩定的樹。
NJ樹,correlation(手工設閩語爲根):
NJ樹,Euclidean(手工設閩語爲根):
NJ樹,Rho(手工設閩語爲根):
首發於2013.12.13,新浪博客
前一篇:[转载]古代的霾和现代的霾