资源描述:
《用38个基因座的基因频率计算中国人群间遗传距离.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、中国科学(C 辑)第28卷 第1期SCIENCEINCHINA(SeriesC)1998年2月用38个基因座的基因频率计算中国人群间遗传距离①杜若甫 肖春杰 L.L.Cavalli2Sforza(中国科学院遗传研究所,北京100101;①DepartmentofGenetics,StanfordUniversity,CA94305,USA)摘要 用38个基因座的基因频率计算了中国不同省、市、自治区汉族及少数民族相互间的遗传距离,并进行了聚类分析.结果表明,中国汉族与少数民族都分为南方蒙古人种与北方蒙古人种两大类
2、型,以长江为界.因此,现代人非洲起源说与本地起源说都必须回答这两大类型是何时分开又如何发展而成的问题.也确凿地从遗传学角度证明各地汉族与当地少数民族血缘相近,说明各地汉族中已融入有大量当地少数民族血缘,同时,各地少数民族也融入了部分汉族血缘.关键词 遗传距离 聚类分析 中华民族 现代人起源遗传学指标最大的优点是其稳定性,遗传物质DNA序列中的核苷酸以一定的频率发生变异,所产生的变异有相当大一部分是中性的,有一小部分虽也受环境选择的一定影响,却稳定地世代相传.因此,遗传指标对研究民族的源与流及民族间的血缘关系,有
3、其特殊的重要性.用遗传标记的基因频率研究民族的源与流也存在一定的不准确性,主要是因为有些基因有时受外界环境选择作用的影响,另一方面,基因频率有时还会由于随机遗传漂变而发生不定的、不规则的变化.削弱或消除这种不准确性的最有效方法之一,是用尽可能多的基因座的基因频率进行分析研究,这样,便可使分析得出的结果更接近实际.中国不少学者曾用基因频率和人体测量学指标、姓氏频率、皮纹学指标等对中国汉族不同人群及少数民族间的遗传距离进行过计算,并根据遗传距离进行了聚类分析,以研究中华民族的源与流,可是,过去最多只用4个基因座的基因
4、频率,而且,除用免疫球蛋白同种异型作遗传[1,2]标记所研究的人群最多之外,所研究的人群一般也只是一二十个.所以,这些研究虽然都[3~8]有一定的意义,但是所利用的基因座太少,所研究的人群也有限,因此进展不大.自1980年以来人类群体遗传学方面开展了大量的研究,积累了大量的基因频率数据,目前已有38个基因座上130个等位基因频率的数据可以利用,而且大部分省、市、自治区的汉族人群和大部分少数民族在一个基因座上的数据往往不止一份而是有好几份,甚至多达29份.因此每一人群、每一基因座上的数据的准确性也大大提高了.但迄今
5、为止,尚无利用已有的全部基因频率数据对中国各民族人群进行遗传距离计算和聚类分析的报道.本文收集了国内外刊物上有关中国汉族和各少数民族的基因频率,以及本室尚未发表的数据,用美国斯坦福大学L.L.Cav2alli2Sforza实验室中的Philip软件,进行了遗传距离计算和聚类分析.1996211215收稿84中 国 科 学 (C 辑)第28卷1 材料与方法111 材料在国内外用人工查阅和计算机检索,共收集到中国人群2千多套基因频率数据(1个人群在1个基因座上的基因频率数据算1套).每1套数据都经Hardy2
6、Weinberg遗传平衡吻合度2检测,如X表明p<0.05,则剔除不用.最后共有1923套数据可用,它们是33个省、市、自治区(包括中国台湾、香港、澳门)的汉族和54个少数民族在38个基因座上的基因频率.但各人群有基因频率数据的基因座多少不一,如新疆、西藏、宁夏等地汉族只有1~3个基因座的数据,而北京、福建、广东、黑龙江等地汉族有28~31个基因座的数据.55个少数民族中,门巴族没有基因频率数据,而回、苗、壮、侗、满、瑶、白、黎、蒙古、维吾尔等族有25~35个基因座的数据.用于进行分析的基因座(即遗传标记)是:A
7、BO,MNSs,Rh,P,Diego,Duffy,Kell,Kidd,Lewis,Lutheran等红细胞血型,白细胞抗原系统中的HLA(A,B,C,D)、酸性磷酸酶、腺苷脱氨酶、腺苷酸激酶、酯酶D、葡萄糖262磷酸脱氢酶、谷丙转氨酶、乙二醛酶、葡萄糖磷酸变位酶21、磷酸葡萄糖酸脱氢酶等红细胞酶α,2抗胰蛋白酶、补体第2,3,4,6,7组分、备解素因子B、血清α2球蛋白、结合珠蛋白、免疫球蛋白Gm因子与Km因子、转铁蛋白等血清蛋白质以及血型分泌型、和耵聍类型、苯硫脲味觉等.其中MNSs与Rh都以1个基因座来对待,
8、而以各单倍型频率作为基因频率.112 统计与分析方法[9]遗传距离用的是Fst遗传距离.在计算各省、市、自治区的汉族人群以及各少数民族间的遗传距离时,每一基因座的基因频率是该省、市、自治区汉族或该少数民族所有取样人群的基因频率的加权平均值.例如,湖北汉族ABO基因座基因频率有29套数据,就将这29套数据按其样本人数进行加权平均,得出平均数,作为湖北汉族ABO基因座的基因频