基于主成分分析的全国主要城市空气质量评价.pdf

基于主成分分析的全国主要城市空气质量评价.pdf

ID:48014988

大小:826.28 KB

页数:2页

时间:2019-07-15

基于主成分分析的全国主要城市空气质量评价.pdf_第1页
基于主成分分析的全国主要城市空气质量评价.pdf_第2页
资源描述:

《基于主成分分析的全国主要城市空气质量评价.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据现代商贸工业ModernBusinessTradeIndustry2014年第10期基于主成分分析的全国主要城市空气质量评价毛宁1(1.北京林业大学林学院,北京100083;2.李益稹2北京林业大学经济管理学院,北京100083)摘要:随着城市化的进程,空气污染问题越来越严重。针对全国31个主要城市的空气质量问题,基于主成分分析方法,借助R软件,利用全国主要城市的空气质量环境影响因素数据进行主成分分析,得出影响空气质量的主要因素。关键词:主成分分析;空气质量;R软件中图分类号:F2文献标

2、识码:A文章编号:16723198(2014)100049021引言随着城市化进程的不断推进,近年来,全国各大城市均频频出现“雾霾”天气,空气质量问题愈发严重。而影响空气质量的因素又是复杂的,只有找到最主要的因素,才可以较好的解决空气质量问题。随着多元统计分析的普及和应用,主成分分析法(PCA)已成为一种新兴的评价方法,在环境质量综合评价方面应用广泛。主成分分析(PrincipleComponentAnalysis,简称PCA)方法是一种把原来多个指标化为少数几个互不相关的综合指标的多元统计方法

3、,可以达到数据化简、揭示变量之间关系和进行统计解释的目的。在实际应用中主要用来对数据集的属性去进行相关分析和降维。而其实判定一个区域的空气质量需考虑的因素十分复杂,进行主成分分析需要抓住其各因素之问的内在关系,寻找影响环境质量的最大因素。2主成分分析方法2.1基本原理主成分分析方法是建立一种从高维空问到低维空问的映射,即把多个指标转化为少数几个综合指标的一种统计分析方法,其目的是在保证信息损失量最小的前提下,尽可能提取问题的主要方面,从而对多变量数据进行最佳综合简化。通常数学上的处理就是将原来m

4、个指标作线性组合,得到一个新的综合指标。选取第一个线性组合Y1(即第一个综合指标)的方差来表示含有信息的多少,若Y1越大,则表示Y1包含的信息量就越多。如果在所有的线性组合中选取的Y1方差最大,则称Y1为第一主成分,其方差在总方差中所占比率称之为解释方差,其方差越大,它的贡献越大,其代表原始数据的能力就愈强。如果第一主成分不足以代表原来m个指标的信息,再考虑选取第2个线性组合Y2,与Y1共同反映原始信息,通常当前n个主成分的方差占总方差的85%以上即可认为这n个主成分能代表该数据的大部分信息。2

5、.2方法步骤2.2.1数据标准化为了排除数量级和量纲不同带来的影响,首先对原始数据进行标准化处理。设P维随机向量x一(x1,x2,⋯,xp)1,n个样品xi一(Xil,Xi2,⋯,XiD)1,i一1,2,⋯,n,n>P,构造样本阵,对样本阵元素进行如下标准化变换:Y寸Z。1一塑丁竺,i一1,2,⋯P∑确∑(x。,面)2其中xj—LL蝎2一卫—二1二,得标准化样本阵nlZ一(Zij)。2.2.2相关系数矩阵计算RZ1Znl∑(。k。Xi)(。k,xj)其中。。一—i!====i=兰==一,i,j一

6、1,2,⋯,p,nn/∑(xk。Xi)2∑(xkxj)2为相关系数。2.2.3特征值和特征向量计算解特征方程xIR一0,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列x1≥x2≥⋯≥k≥0。分别求出对应于特征值x.的特征向量e.(i一1,2,⋯,p),要求e。一1,即∑ei一1,其中e。,表示向量e。的第j个分量。计算主成分贡献率及累计贡献率:贡献率:累计贡献率:亡、善(i一1.2.⋯.p)娑(i一1.2.⋯.p)簋“k一般取累计贡献率达85%~95%的特征值沁,x2,⋯,x。,所

7、对应的第1、第2、⋯、第m(m≤p)个主成分。计算主成分载荷:lij—p(zi,xj)一/^。eij(i,j一1,2,⋯,p)各主成分的得分:Zz11Z12Z21z22:●znlzn23实验分析3.1实验数据介绍实验分析选取了2009年北京、天津、石家庄、长春、哈尔滨、太原和银川I等31个中国主要城市的空气质量指标数据,其中包括的污染因子为二氧化硫、二氧化氮、可吸入颗粒物三个变量(单位:毫克/立方米),应用上述主成分分析方法,借助R软件按上述的步骤进行计算。49肿脚;唧m研纯;%万方数据现代商贸

8、工业ModernBusinessTradeIndustry2014年第10期表1主要城市空气质量指标(2009年)3.2实验流程(1)首先计算三种指标的相关系数矩阵,运用R软件中的cor(x)语句,计算结果如下:表2三项指标相关系数表(2)由特征方程xIR一0,解出表2中的矩阵特征值。在R软件中输入eigen(cor(x))语句,即可得到相关系数矩阵的特征值和特征向量。得出3个特征值的精确近似值从大到小排列为:1.8551782、0.7432156、0.4016063。特征向量见表3。表3全局主

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。