聚类分析-结果2

聚类分析-结果2

ID:44652094

大小:656.52 KB

页数:16页

时间:2019-10-24

聚类分析-结果2_第1页
聚类分析-结果2_第2页
聚类分析-结果2_第3页
聚类分析-结果2_第4页
聚类分析-结果2_第5页
资源描述:

《聚类分析-结果2》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第七章聚类分析第一节遗传距离数量性状遗传研究中,常常需要在多性状水平上度量个体或群体间的亲疏关系,遗传距离是在多性状水平上概括这些研究对象间的亲缘关系疏远程度的有效统计量之一。通过对遗传距离的聚类分析,不仅可以认识所研究对象(个体或群体)间亲缘关系的远近,还可进一步研究不同类群间关系远近与杂种优势的关系,为杂交育种和杂种优势的利用提供理论和材料依据。下面首先介绍有关遗传距离的基本概念一样品与变量,然后介绍遗传距离的具体计算,第三部分介绍聚类分析。一、样品与变量遗传距离可以通过三种不同类型信息获得:

2、表型信息、分子(包括DNA和蛋口质)标记信息和系谱信息,由这三种信息求得的遗传距离分别称为表型遗传距离、遗传标记距离和系谱遗传距离。在聚类分析中有两个很重要的概念:样品和变量。样品是所研究的对象,如不同群体、不同品种以及变异群体内的不同个体等。为了研究样品间的关系,需要拟定一些指标來测试这些样品,这些指标就是变量,如株高、产量、籽粒长度、胚颜色等为表型性状变量;采用分子生物学技术获得的“0、1”型标记变量被称为分子标记变量。样品间表型性状变量和分子标记变量的遗传距离计算方法不同,下面分别叙述。二、

3、基于数量性状表型数据的遗传距离(一)数据变换一般來说,用來考察样品的表型性状变量有多个,这些变量使用的量纲会有不同,取值范围也不相同。为了使不同量纲、不同取值范围的数据能放在一起进行比较,通常需要对原始数据进行变换处理,使之变成无量纲而具可比性。假设有个样品,加个变量,儿表示第,个样品在第丿•个变量的观测值,z==观测值数据列于表7-1o1■■■■1•••儿…儿…几”••••••X1•…%•…九•••••••••••••••n儿1%九平均值歹标准差$极差R歹I・・•刀・・・九$]…Sj…sm&…R

4、j…心对于观测值数据,通常采用的数据变换方法有:1.标准差标准化变换:y:j=―(心1,2,•••,〃;./=1,2,…,血)(7-1)S・变换后揄数据兀无量纲,每个变量的样本均值为0,标准差为lo2.极差标准化变换:y;j=儿力(i=1,2,…,砒=1,2,…,加)(7-2)j变换后的数据y;无量纲,每个变量的样本均值为0,极差为1,且

5、y;

6、

7、0;Z=1,2,・・・,〃;/=1,2,…加)(7-4)该变换是将具有指数特征的数据结构转换为线性数据结构。此外,述有平方根变换,立方根变换等。它们的主要作用是把非线性数据结构变为线性数据结构,以适应某些统计方法(如线性模型分析方法等)的需耍。5.主成分变换:在植物育种过程中,一般需要从多个性状上考查与评价品种。由于基因多效性或遗传连锁等原因往往导致被考查性状间存在显著的相关性。这种情况下,可以把多个具有相关关系的性状(变量)通过主成分变换,转化为少数几个独立并具有主导作用的综合变量。主成分变换的

8、方法与详细过程参阅裴鑫徳(1991),范金城等(2002),高惠璇(2001),梅长林(2002)。主成分变换在解决性状间的相关问题上确实有其优点,但在选取主成分时毕竟有部分信息损失,因此,该变换方法并没有在表型遗传距离计算中被广泛采用。(二)距离的计算对具有不同量纲的表型数据完成数据变换Z后,即可计算样品间的遣传距离。把斤个样品看成加维空间中的几个点,用q.表示样品,和丿•之间的距离,一般要求:①>o,对一切门;②几=5,对一切门;③D..<久+D曲,对一切i,以(三角不等式)对于表型性状,常用

9、的距离计算方法有两种:1.欧氏距离:J加2若(龙-加(门=1,2,・・・加(7-5)由于欧式距离具有帚好的几何特性,在聚类分析的距离计算过程中被广泛应用。例7.1调查8个栽培棉花品种(其中,4个陆地棉品种:TM-K611、斯字棉2B和乌干达棉;4个海岛棉品种:5476・H、军海1号、埃棉3号和吉扎80号)的10个表型性状,数据列于表7・3,试计算8个棉花品种间的欧氏距离。表7・38个棉花品种的观测性状值编号品种果枝节位(个)果枝数(个)单株铃数(个)铃重(g)衣分(%)籽指(g)2.5%跨长(mm

10、)比强度(cN/tex)种仁脂肪(mg)种仁蛋白(mg)1TM-18・612.015.05.633.212.429.919.635.739.325476-H5・716.313.23.329.012.931.926.634.838.93611B5・414.417.16・133.011.328.017.438.639.24军海13・518・420.03・126.512.732.926.434.238.3号5斯字棉2B7・513.313.26.134.012.730.319.033.73

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。