统计建模与R软件课程报告材料.doc

统计建模与R软件课程报告材料.doc

ID:56926196

大小:1007.02 KB

页数:16页

时间:2020-07-24

统计建模与R软件课程报告材料.doc_第1页
统计建模与R软件课程报告材料.doc_第2页
统计建模与R软件课程报告材料.doc_第3页
统计建模与R软件课程报告材料.doc_第4页
统计建模与R软件课程报告材料.doc_第5页
资源描述:

《统计建模与R软件课程报告材料.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、统计建模与R软件课程报告对某地区农业生态经济的发展状况作主成分分析摘要主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相关独立或不相关的变量。通常是选出比原始变量个数少,又能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。也就是说,主成分分析实际上是一种降维方法。关键词:主成分分析相关矩阵相关R函数目录1绪论21.1主成分方法简介22总体主成分22.1主成分的定义与导出22.2主成分的性质32.3从相关矩阵出发求主成分52.4相关的R函数63数据模拟74结论及对该模型的评

2、价12参考文献121绪论1.1主成分方法简介主成分分析(principalcomponentanalysis)是将多个指标化为少数几个综合指标的一种统计分析方法,由Pearson(1901)提出,后来被Hotelling(1933)发展了。主成分分析是一种通过降维技术把多个变量化成少数几个主成分的方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的线性组合。主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计

3、分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。2总体主成分2.1主成分的定义与导出设Χ是p维随机变量,并假设,。考虑如下线性变换(2.1)易见,(2.2),(2.3)我们希望的方差达到最大,即是约束优化问题的解。因此,是最大特征值(不妨设为)的特征向量。此时,称

4、为第一主成分。类似地,希望的方差达到最大,并且要求。由于是的特征向量,所以,选择的应与正交。类似于前面的推导,是第二大特征值(不妨设为)的特征向量。称为第二主成分。一般情况下对于协方差阵,存在正交阵,将它化为对角阵,即(2.4)且,则矩阵的第列就对应于,相应的为第主成分。2.2主成分的性质关于主成分有如下性质:(1)主成分的均值和协方差阵。记,,由于(2.5)所以有.(2)主成分的总方差由于所以或,其中是协方差阵的第个对角元素。由此可以看出,主成分分析把p个原始变量的总方差分解成了p个不相关变量的方差之和。称总方差中第主成分的比例为主成分的贡献率。第一主成分的

5、贡献率最大,表明它解释原始变量的能力最强,而的解释能力依次减弱。主成分分析的目的就是为了减少变量的个数,因而一般不会使用所有的p个主成分,忽略一些较小方差的主成分,不会给总方差带来大的影响。称前m个主成分的贡献率之和为主成分的累积贡献率,它表明解释的能力。相对于p,通常取较小的m,使得累积贡献率达到一个较高的百分比(如80%~90%)。此时,可用来代替,达到降维的目的,而信息的损失却不多。(3)原始变量与主成分之间的相关系数由式(1.5)知(2.6)即,(2.7)所以,,(2.8),.(2.9)在实际应用中,通常只对与的相关系数感兴趣。(4)个主成分对原始变量

6、的贡献率前面提到的累积贡献率这个概念度量了个主成分从原始变量中提取信息的多少,那么包含有的多少信息应该用什么指标来度量呢?这个指标就是与的复相关系数的平方,称为个主成分对原始变量的贡献率,记为,即.(2.10)对式(1.7)两边取方差,得到,(2.11)由于,故实际上是的加权平均。由式(1.10)~式(1.11),可以得到对的贡献率为.(2.12)(5)原始变量对主成分的影响式(1.5)也可以写成,称为第主成分在第个原始变量上的载荷,它度量了对的重要程度。2.3从相关矩阵出发求主成分当各变量的单位不完全相同,或虽单位相同,但变量间的数值大小相差较大时,直接从协

7、方差阵出发进行主成分分析就显得不妥。为了使主成分分析能够均等地对待每一个原始变量,消除由于单位不同可能带来的影响,常常将原始变量作标准化处理,即令,(2.13)显然,的方差矩阵就是的相关矩阵。从相关矩阵出发导出的主成分方法与从协方差出发导出的主成分方法完全类似,并且得到的主成分的一些行之更加简洁。设为相关矩阵的p个特征值,为相应的单位特征向量,且相互正交,则相应的p个主成分为,。令,,于是.关于相关矩阵的主成分有如下性质:(1),其中.(2).(3)变量与主成分之间的相关系数为,.(4)主成分对的贡献率为.(5).2.4相关的R函数与主成分分析有关的函数主要有

8、以下一些:1.princomp函数作主

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。