医学高级统计学_第十章聚类分析.pdf

医学高级统计学_第十章聚类分析.pdf

ID:50925714

大小:3.65 MB

页数:132页

时间:2020-03-08

医学高级统计学_第十章聚类分析.pdf_第1页
医学高级统计学_第十章聚类分析.pdf_第2页
医学高级统计学_第十章聚类分析.pdf_第3页
医学高级统计学_第十章聚类分析.pdf_第4页
医学高级统计学_第十章聚类分析.pdf_第5页
资源描述:

《医学高级统计学_第十章聚类分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十章聚类分析姜晶梅流行病与统计学系北京协和医学院基础学院2018.6.211本章小结主成分基本原理解析ZaXaXaX11111221ppZaXaXaX22112222ppZAXZiiaXZaXaXaXpppppp1122从几何学上讲:主成分分析的过程就是坐标旋转的过程,在新坐标系中各坐标轴的方向就是原始数据变异最大的方向;从代数变换上讲:主成分分析的过程就是带约束条件的线性变换,将相关变量变换为独立变量;222VarZ()aaiiiiaa1(i1,2,,)pai12aiaip1ii(ip1,2,,

2、)CovZZ(,)0ij2,复习主成分基本原理解析ZaXaXaX11111221ppZaXaXaX22112222ppZaXaXaXpp11p22ppp从协方差矩阵角度来讲:主成分分析就是将原始变量的协方差矩阵对角化的过程;主成分的协方差矩阵CovZ()为aaaaaa11121paaaaaaCovZ()CovAX()ACovXA()21222paaaaaap12ppp由于aaij,(,ij1,2,pi,;j)是相互正交的特征向量,因此,aaij0,0a

3、aijaa00001110aa000CovZ()222diag(,,,)12p00aa003ppp复习主成分基本原理解析ZaXaXaX11111221ppZaXaXaX22112222ppZaXaXaXpppppp1122从信息量变化的角度来讲,主成分分析是对原始变量信息的一种提取,主成分不增加总信息量,也不减少总信息量,只是对原信息进行了重新分配。ppVarZ()iitr(AA)tr(AA)ii11ptr(I)

4、tr()VarX(i)i14ZaXaXaX11111221pp8.2.3主成分的性质Z2aX211aX222aX2ppZaXaXaXpp11p22ppp2.主成分Z与原始变量Xj间的相关系数i5CovZX(,)aaijiijiij(,ZX)(,ij1,2,p,)ijVarZVarX()()ijijjjj6P171,式8.1071.正交因子模型XFFF1111112211mmXFFF2221122222mm()mpXFFFpp

5、pppmmp1122XAF(1)(ppmmp)(1)(1)方统CovX()EX()()X差称结为=AEFFA()()()()EFAAEFE构正交()AAVar因子AAD模型CovXF(,)EXEX()FEF()的=EX()FEAF()F协=AEFF()E(F)8=AXFFF1111112211mmXFFF正交因子模型的统计量2221122222mm()mpXFFFppppp

6、mmp11229XFFF1111112211mmXFFF2221122222mm()mpXFFFpppppmmp112210XFFF1111112211mmXFFF2221122222mm()mpXFFFpppppmmp112211人物以以群类分聚分类学是人类认识世界的基础科学。聚类分析是研究事物分类的基本方法,广泛地应用于自然科学、社会科学、工农业生产的各个领域。12主要内容一、序言二、距离与相似系数三、系统

7、聚类法四、动态聚类法13一、序言:什么是聚类分析人类认识世界往往首先将被认识的对象进行分类,因此,分类学便成了人类认识世界的基础科学。在古老的分类学中,人们主要靠经验和专业知识实现分类。随着生产技术和科学的发展,人类对自然的认识不断深入,分类也越来越细,要求亦越来越高,当数学这个有用的工具逐渐被引进到分类学中,便形成数值的分类学。例如:对我国30个省市自治区独立核算工业企业经济效益的分析;对某些大城市物价指数考核等;在卫生管理学中,希望能根据医院的诊治水平、工作效率等众多指标将医院分成几个类别;比如学生成绩数据就可以对学生按照

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。