人类群体遗传结构的图论主坐标分析方法

人类群体遗传结构的图论主坐标分析方法

ID:24615703

大小:53.00 KB

页数:7页

时间:2018-11-14

人类群体遗传结构的图论主坐标分析方法_第1页
人类群体遗传结构的图论主坐标分析方法_第2页
人类群体遗传结构的图论主坐标分析方法_第3页
人类群体遗传结构的图论主坐标分析方法_第4页
人类群体遗传结构的图论主坐标分析方法_第5页
资源描述:

《人类群体遗传结构的图论主坐标分析方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、人类群体遗传结构的图论主坐标分析方法  某人群中某位点上各等位基因的频率,即是该群体在该位点上的遗传结构;其全部位点上的基因频率即是该人群的整个遗传结构。人群遗传结构的差异,实质上是基因频率的差异。人类群体遗传变异性水平受人口迁移、人群融合、自然选择、漂变、地理和社会隔离、突变等多因素的综合影响,这些因素的综合作用构成了群体内或群体间某位点或多位点的遗传结构。遗传结构数据可用基因频率矩阵表示。由于群体内或群体间广泛存在基因多态性现象,一个位点常常包括多个等位基因,多个位点所包含的等位基因数目和组合方式则更是复杂多样。如果仅用某位点中的一

2、个等位基因分析其群体遗传结构,不能充分利用其遗传变异信息,结论是片面的,故须对每个基因分别进行分析。但是,利用不同基因所作的分析其结论往往不同,难以统一。传统的解决方法之一是对基因频率矩阵进行主坐标分析,将各群体的主坐标作为新的综合指标,再以散点图的形式映射到二维或三维空间中,从而帮助研究者从整体上分析人类群体遗传结构的基本规律。因而,在群体遗传学研究中被广泛应用但是,尽管主坐标分析能在二维或三维空间中显示各群体的遗传结构,却不能揭示各群体之间的内在关系。本研究认为,    将图论方法与主坐标分析有机结合,利用图论方法构建各群体的最小生

3、成树(minimalspanning中心化基因频率矩阵中的元素为数值变量资料,tree,MST),并把最小生成树整合到主坐标散点图可选择欧氏(Euclidean)距离、马氏(Manhattan)距上,即可进一步揭示主坐标散点图中各群体之间离、曼哈顿(Block区组)距离、Bray-Curtis距离或的内在遗传结构关系,称之为图论主坐标分析Kulczynski距离等不相似性测度构建群体(dK)间(graphtheoryprinc;palcoordinatesanaiysis)<dcRibli的n>n阶不相似性矩阵;③将不相似性

4、测度进行0.5dK转化,该转换可保证在计算过程中保持原有的不相似性;④对转换后的矩阵进行谱分解获得特征根L及其对应的特征向量U,并进一步计算各主坐标的贡献率及其累计贡献率;⑤根据Y=-u计算主坐标值,取前1、主坐标绘制二维主坐标散点图。  1.2.2按图论原理求过m维空间n个点的最小生成树  ⑴图论与最小生成树的基本概念图论是近年来较活跃的数学分支之一,其研究对象为图。图[7]是指某类具体事物的顶点(vertex,或节点note)以及它们间的联系(图1)。节点与节点之间用线段联系,称为边(edge,或支路branch);某边的端点称为与

5、该边的关联(incident),与同一边关联的两个端点称为邻接(adjacant);起点与终点重合的通路为回路(circuit)。若图中两端点间由一条通路连接,则两端点是联通的(connected),该图称为联通图;不含有回路的连通图称为“对”,树中的边称为树枝。可以证明树中任两顶点间必有一条且仅有一条通路。如果T图是G图的一个生成子图,且它又是‘树”,则T是G的生成树(span?ningtree)。设一个生成树的边的长度之和为权,则具有最小权的生成树称为最优树(optionaltree)或最小生成树。有n个顶点的树,可能会有n-2个生

6、成树,但仅有一个最小生成树。构造最小生成树的方法常用避圈法或‘破圈法”。避圈法”中又分为以权重为主的Kruskal法和以点为主的Prim法,‘破圈法”则以逐步删除边”为基本思路。  ⑵最小生成树的生成步骤①以基因频率矩阵X为基础,利用欧氏距离构造权矩阵;②以权矩阵为基础,利用Kruskal法构造最小生成树。首先选择并连接权重或相似性最大(或距离最短)的两点,再在剩余的点中选择与这两点之一相似性最大的点与之连接;再以相似性大小,逐次把剩余的点与巳连成的点连接起来,直至把所有点连接完为止,即可形成一个最小生成树。  1.2.3分割最小生成树

7、用图论中求‘颈”的方法[itruCiu-batii.proghtml<proghtml>/617/61756.htm)和PAST-1.30(byHammer[11].http://folk.uio.no/ohammer/past/dol)两个软件完成上述所有运算。  2实例分析--中国26个汉族人群HLA-  A位点群体遗传空间结构的图论主坐标分析  2.1群体遗传学资料根据不同地理环境,收集中国26个汉族群体的HLA-A基因多态性群体遗传学调查数据,以各基因的基因频率为指标进行统计,标准为:①样本含量大于100;②设一个人

8、群的基因频率为一套,对每套数据先进行c2检验,剔除不符合Hardy-A-Alocusin类群体,需根据最小生成树的链接关系而定。例如,甘肃与河南两群体的空间位置虽很近,但它们在最小生成树中不相连,二者分属于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。