本文运用多元统计分析中介绍的主成分分析方法和聚类分...

本文运用多元统计分析中介绍的主成分分析方法和聚类分...

ID:30504296

大小:304.47 KB

页数:13页

时间:2018-12-30

本文运用多元统计分析中介绍的主成分分析方法和聚类分..._第1页
本文运用多元统计分析中介绍的主成分分析方法和聚类分..._第2页
本文运用多元统计分析中介绍的主成分分析方法和聚类分..._第3页
本文运用多元统计分析中介绍的主成分分析方法和聚类分..._第4页
本文运用多元统计分析中介绍的主成分分析方法和聚类分..._第5页
资源描述:

《本文运用多元统计分析中介绍的主成分分析方法和聚类分...》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、武汉理工大学《多元统计分析》课程设计我国各省市的污染类型分析摘要本文运用多元统计分析中介绍的主成分分析方法和聚类分析方法,在2006年中国统计年鉴所提供的数据基础上,对所列出的31个省,市,自治区的环境指标进行主成分分析后再以所得到的因子进行聚类分析,从而确定每个城市所处的类别得出其环境污染类型。针对不同的污染类型,需要有侧重的进行治理,为环保部门提供一些依据。关键词:主成分分析;因子分析;皮尔逊相关系数ThePollutionTypeAnalysisofOurCountry’sEveryProvinceAbstractInthisarticlethefactoranalysi

2、smethodandclusteringanalysismethodwhichareintroducedintheAppliedMultivariateStatisticalAnalysisareused.OnthenumbersuppliedbytheChinaYearbook2006,weusethefactoranalysismethodtoanalysisthe10environmentvariancesaboutthegiven31provincesinordertogetthemainfactors.Then,wecanclustertheprovincesbyth

3、emainfactors,sowecanknowthepollutiontypeafterclustering.Todifferentpollutiontype,differentmethodareneeded.WewanttogivesomeadvicestotheEnvironmentProtectionDepartmentbytheresultofthisarticle.Keywords:MainComponentAnalysis,FactorAnalysis,PearsonCorrelation1武汉理工大学《多元统计分析》课程设计1.引言由于人们对工业高度发达的负面影

4、响预料不够,预防不利,导致了全球性的三大危机:资源短缺,环境污染,生态破坏。环境保护,随着现在时代的进步,人民生活水平的提高,这一字眼在人们的生活中出现的次数也越来越频繁。由于我国现在正处于迅速推进工业化和城市化的发展阶段,对自然资源的开发强度不断加大,加之粗放型的经济增长方式,技术水平和管理水平比较落后,污染物排放量不断增加。从全国总的情况来看,我国环境污染仍在加剧,生态恶化积重难返,环境形势不容乐观。我国的环境污染现状已经到了非常严重的地步了,最近爆发的太湖水污染事件充分说明了事情的严重性。水污染事件的发生导致沐阳20多万人没有干净水喝,这还只是单一方面的污染事件。有专家预

5、计,我国很多水域都有可能发生类似的大面积的污染事件。因此,充分认识各个地区的环境污染特点,有针对性的采取相应的措施,虽然环境污染并不是只影响单一区域,而具有全球性影响,但是各个地区将本地的污染最严重的方面进行治理后,将对治理全国范围内的污染有比较好的效果。2理论部分2.1主成分分析主成分分析所关心的问题,是通过一组变量的几个线形组合来解释这组变量的方差—协方差结构。它的一般目的是:(1)数据的压缩;(2)数据的解释。虽要求P个成分可以再现全系统的变异性,但大部分变异性常常只用少数K个主成分就可说明。这时,这K个主成分所包含的信息和那P个原变量所包含的信息(几乎)一样多。主成分,

6、在代数学上是P个随机变量XXLX的一些特殊的线形组合。而在几何学这些线形组合代表选取一1,2P个新坐标系,它是以XX,LX为坐标轴的原坐标系旋转后得到的。设随机向量12PTX=[XX,LX]有协方差阵Σ,其特征值λ≥λ≥Lλ≥0。对应的特征向量为12P12Pee,Le。则第i个主成分由Y=eX+eX+L+eXi,=1,2...p此时,12pii11i22ippTTVar(Y)=e∑e=λ,i=1,2...p,CovYY(,)=e∑e=0,i≠k.如某些λ相等,那么对应的iiiiikiki系数向量e的选取从而Y的选取,就都不是惟一的。ii2武汉理工大学《多元统计分析》课程设计对于

7、样本来说,其主成分的计算同总体的计算是一样的。但是在做样本的主成分时,需要考虑是以样本的协方差阵还是以样本的相关系数阵来计算其特征值与特征向量。对于这个问题我们采取以下原则:用于解释主成分时只用成分系数e而不是用相关系数。虽说i作为变量对已知成分的重要性的测度,系数和相关可能导出不同的重要性等级,但是我们的经验表明,这种等级的差别常常不是大到很明显。在实践中,有较大(按绝对值)系数的变量,趋向于有较大的相关,故这两个重要性的测度(前者为多变量,后者为单变量)经常给出相似的结果。建议既考虑系数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。