主成分分析(修改后)

主成分分析(修改后)

ID:27709046

大小:443.99 KB

页数:24页

时间:2018-12-05

主成分分析(修改后)_第1页
主成分分析(修改后)_第2页
主成分分析(修改后)_第3页
主成分分析(修改后)_第4页
主成分分析(修改后)_第5页
资源描述:

《主成分分析(修改后)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、1.基于主成分分析的空气污染数据探究摘要本文讨论Y有关分析处理空气污染数据的问题。对于问题一比较样本协方差矩阵和样本相关矩阵主成分分析的结果差异。首先,本文采用降维的思想,运用主成分分析法减少变量的个数,借助Matlab软件建立有关7项指标的协方差矩阵和样木相关矩阵,得出其特征值和特征向量;其次,分别计算各自主成分的贡献率,对于样本协方差矩阵,前三个主成分的贡献率分别为87.20%,95.33%和98.62%,对于样本相关矩阵,根裾主成分个数提取原则,提取特征值大于1的成分,从而确定三种主成分,它们在反应样本数据信息中所占的贡献率分别为33.03%,19.76%和17.

2、30%;从而发现样本相关矩阵的求解结果更符合实际。对于问题二选择三个或者更少的主成分反映原始数据的变化及原因。样本协方差矩阵的前三个主成分累计贡献率为98.62%,而样本相关矩阵的前三个主成分累计贡献率为70.09%;从而得出结论:样本相关矩阵的结论更符合实际,确定空气污染程度需根据原始数据综合前三个样本成分。考虑到各主成分之间存在的相互依赖关系,将模型进行推广,进一步运用回归分析法预测和控制空气污染的主要成分,得到的结果将更加贴近实际情况。关键词主成分分析;降维思想;空气污染符号xYCov(Uj)PAi一、问题重述己知某城市在42天中中午12点的7项空气污染数据:风速

3、、太阳辐射、CO、NO、NO2、O3、HC,完成以下问题:问题一:分别利用样本协方差矩阵和样本相关矩阵作主成分分析,比较二者结果差异;问题二:选择三个或者更少的主成分反映原始数据的变化并作出解释。二、问题分析空气污染是现下较为严重且广受关注的热点问题,研究污染空气的主要因素及特点有助于控制空气污染源,为改善环境提供必要依据。由于题目所给数据较多,需要对其进行处理分析,因此本文将采取主成分分析法([1])分析影响空气污染的主要因素。对于问题一:首先,利用Matlab求出样本协方差矩阵和样本相关矩阵;其次,分别计算这两个矩阵的特征值与特征向量,及相应的主成分贡献率与累计贡献

4、率;比较结果分析其差异;对与问题二:根据累计贡献率的大小,选择前几个主成分代替原来的7个变量,使得信息损失最小,并对比所选取的主成分与原始数据对比做出合理解释。三、模型假设1.假设己知数据均真实有效,具有统计价值;2.忽略其他对空气污染造成微小影响的空气成分。、符号说明符号含义样木方差原始变量样本主成分样本协方差样本相关矩阵样木平均值Z协方差矩阵P特征向量矩阵A矩阵的特征值e矩阵的特征向量五、模型建立与求解问题中的变量太多不但会增加计算的复杂性,而II也给合理的分析问题和解决问题带来很大的困难:同时,这些变量之间存在一定的相关性,也使得这些变量所反映的信息在一定程度上有

5、所重叠。为了减少变量的个数,同吋提高问题研宄的合理性,本文采用了降维的思想,利用主成分分析法来减少变量的个数,同时不会使数据反映的信息量有大的损失。5.1协方差矩阵主成分分析设Z是%=0:1,12,%3,一,^广的协方差矩阵,2:的特征值与正交化特征向量分别为42乂22…2/1,,20及A,e2,e3,…,,.目.x的第z•个主成分为(=enxl+ei2x2+ei3x3+••-eipxp,(/=1,2,3,•••,/?)(1)根据已有数据计算得样本xzCrpXyXy,')7的均值向量;i=(足,叉2,又3,...,)7为%=(7.573.83334.47622.190

6、510.04769.40483.0952/根据协方差矩阵计算公式1n-1n/=1(2)利用Matlab软件代入数据可求得随机变量x=相应的样本协方差矩阵为(只写下三角)-2.7195299.9472-0.41464.1545-0.4634-1.3577-0.58546.8618-2.231730.72760.17070.65042.50001.81650.76071.18232.31821.08832.9977-0.81070.14870.176511.36353.126630.97851.04410.59470.4785利用特征值计算公式

7、/l£-Z

8、=0代入数据可求

9、得Z的特征值為与对疲单位正交化特征向量啡=1,2,…,7)分别为A,=303.6941,=(0.0099-0.9932-0.01500.0046一0.0246-0.1125一0.0024)丁A2=28.3132,e2=(0.07660.1163-0.10590.0128-0.1501-0.9727-0.0237)T=11.4674,=(-0.0314-0.00700.18610.13200.9541-0.17110.0851)TA4=2.5494,e4=(0.8996-0.0005-0.1998-0.34670.II880.06700.1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。