欢迎来到天天文库
浏览记录
ID:58921521
大小:1.17 MB
页数:69页
时间:2020-09-29
《主成分分析与因子分析(第20章)ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、主成分分析与因子分析1讲课内容:第一节主成分分析第二节因子分析2第一节主成分分析3一、基本思想数据的降维、数据的解释将原来众多具有一定相关性的指标,组合成一组新的相互无关的综合指标。从中选取几个较少的综合指标尽可能多的反映原来众多指标的信息。这种既减少了指标的数目又抓住了主要矛盾的做法有利于问题的分析和处理。45如何利用这些指标对每一儿童的生长发育作出正确评价?仅用单一指标:结论片面;没有充分利用原有数据信息。利用所有指标:各指标评价的结论可能不一致,使综合评价困难;工作量大。6找出几个综合指标(长度、围度、特体),这些综合指标是原始指标的线
2、性组合,既保留了原始指标的信息,且互不相关。各综合指标提供的“信息”量大小用其方差来衡量。衡量一个指标的好坏除了正确性与精确性外,还必须能充分反映个体间的变异,一项指标在个体间的变异越大,提供的信息量越多。7二、数学模型及几何意义89第一主成分在所有Zi中最大10第二主成分……理论上主成分个数最多为个(指标个数)实际工作中确定的主成分个数总是小于个在所有Zi中为第2大。无关,互相垂直:11相关变异1213相关变异14三、主成分的求法及性质15(一)主成分的求法.对各原始指标值进行标准化为了方便,仍用表示’。16标准化后的数据矩阵X=17.求出
3、,,…,的相关矩阵R=Cov(X)=18Pearson相关系数标准化后的协方差协方差193.求出矩阵R的全部特征值(eigenvalue)i,第i个主成分的组合系数ai1,ai2,,aim满足方程组:(r11-i)ai1+r12ai2++r1maim=0r21ai1+(r22-i)ai2++r2maim=0rm1ai1+rm2ai2++(rmm-i)aim=020(-)(-)(-)为矩阵的第个特征值,共有个非负特征值,由大到小的顺序排列为:≥≥≥≥()21.由以上方程组,求出相应于特征值的特征向量
4、()(,,,)’22(二)主成分的性质.各主成分互不相关23.主成分的贡献率与累积贡献率(原始指标值标准化)(指标个数)贡献率累积贡献率24.主成分个数的选取()前个主成分的累积贡献率>。()主成分的特征值≥。4.因子载荷(第i主成分Zi与第j原始指标Xi间相关系数)25.样品的主成分得分26四、实例27282930.主成分个数的选取很接近于;与的贡献率相差不大,为左右,若舍去不合理。取前三个主成分。31.列出主成分表达式为急性炎症成分(转氨酶、肝大指数)为慢性炎症成分(硫酸锌浊度)为癌变成分(甲胎球蛋白)32.求出因子载荷阵33
5、.主成分得分34标准化指标主成分还原为原始指标主成分35将该肝病患者的四项肝功能指标代入原始指标主成分表达式:--该肝病患者可能为急性炎症。36五、主成分分析的应用.对原始指标进行综合以互不相关的较少个综合指标反应众多原始指标提供的信息。主成分回归(解决多元共线问题)。2.进行综合评价37.进行探索性分析利用因子载荷阵,找出影响各综合指标的主要原始指标。.对样品进行分类利用主成分得分对样品进行分类:为急性炎症成分为慢性炎症成分为癌变成分38第二节因子分析39一、因子分析基本思想从分析多个可观测的原始指标的相关关系入手,找到支配这种相关关系的有
6、限个不可观测的潜在变量。是多元分析中处理降维的一种统计方法。如:脑部疾病患者的意识清醒状态可由语言能力、辩识能力、记忆能力、理解能力与思维逻辑能力等可观测的指标反映。40二、因子分析数学模型X1:收缩压X2:舒张压X3:心跳间隔X4:呼吸间隔X5:舌下温度F1:交感神经F2:副交感神经41specificfactorcommonfactor42:观测指标(标准化数据):公因子:特殊因子:因子载荷(计算关键项)43444546三、因子模型的性质矩阵的统计意义.公共度(共性方差)47因子的共性方差482.因子贡献与因子贡献率矩阵A第j列元素反映了
7、第j个公因子Fj对所有原始指标的影响;数据标准化后全部原始指标的总方差为指标个数m。Fj对原始指标的方差贡献率49各因子的贡献50.因子载荷及因子载荷阵A51四、因子载荷阵的求解及计算步骤.收集原始数据并整理为下表522.对各指标进行标准化3.求指标间的相关系数矩阵RX4.求指标间的约相关系数矩阵R*(1)R*的非对角线元素与相关矩阵RX的非对角线元素相等(2)R*的对角线元素为共性方差53.求出约关系数矩阵*所有大于零的特征值及相应的特征向量.写出因子载荷阵,得出原始指标的公因子表达式54要求:1.保留公因子个数q小于指标个数m,原则:j
8、≥1前k个公因子累积贡献率≥70%2.各共性方差接近于1。3.各原始指标在同一公因子Fj上的因子载荷之间的差别应尽可能大。55五、实例56.主成分解575859主成
此文档下载收益归作者所有