欢迎来到天天文库
浏览记录
ID:50812160
大小:24.63 KB
页数:2页
时间:2020-03-14
《PCA原理、目的、步骤.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1、工作原理及步骤由于数据拥有过多的指标,且每一个指标对于分析道路分类的贡献率都有所不同,有些贡献率较低的指标产生了噪音与冗余。由此,我们对本文的数据采用PCA主成分分析法来得到每一指标的贡献率,并生成新的较少的主元特征(指标)来进行数据分析。PCA的原理是将原来的样本数据投影到一个新的空间中,相当于将一组矩阵映射道另外的坐标系下。经过映射后的新坐标,去除掉贡献较小的变量,只留下具有最大线性无关组的特征值来对应。其算法核心思想就是将n维特征映射到k维上(k2、维成为主元,是重新构造出来的k维特征,而不是简单地从n维特征中取出其余n-k维特征。本文采用Matlab软件进行PCA分析。PCA的工作步骤主要分为以下几步:(1)将原始数据中每个样本用一个向量表示,然后把所有样本组合起来构成一个矩阵。为了避免样本的单位的影响,样本集需要标准化,将其归一化处理并减去其列平均值使得每一列平均值为0。将新的数据组成m*n的矩阵X,其中m代表8个样本街道数,n代表9个步行环境指标。(2)求出X的协方差矩阵covX(里面c1换成x1)(3)求协方差矩阵的特征值λ与特征向量3、ξ,用来计算每一指标的贡献率与得到n维到k维的映射:Xξ=λξ(ξ上加箭头)由式几点几可以得到n个特征值λ1,…λn与n个特征向量ξ1,ξ2,…,ξn,可以组成一个n维特征值向量l:(l加箭头)l=(λ1,…λn)T与变换矩阵C=(ξ1,ξ2,…,ξn)(4)根据特征值向量,得出新的指标x’i的贡献率ψ’iψ’i=ψ’i/Σψ’i根据贡献率ψi由大到小重排变换矩阵C,选取前k个贡献率大的特征向量ξi,使得其总和超过阈值即可,将其组成新的矩阵C’=[ξ’1,ξ’2,…,ξ’k]由式几点几,通过变换矩4、阵C’将原有数据矩阵X映射为新的数据矩阵X’:X’=XC=式几点几放到后面步骤:根据变换矩阵C,亦可算出X与X’的权重矩阵Φm×n,其中:φij=5、cij6、/Σ7、c.j8、由权重矩阵与特征值向量l,可以得出原有指标xi的贡献率ψi有:Ψ=Φl=(ψ1,ψ2,…,ψn)
2、维成为主元,是重新构造出来的k维特征,而不是简单地从n维特征中取出其余n-k维特征。本文采用Matlab软件进行PCA分析。PCA的工作步骤主要分为以下几步:(1)将原始数据中每个样本用一个向量表示,然后把所有样本组合起来构成一个矩阵。为了避免样本的单位的影响,样本集需要标准化,将其归一化处理并减去其列平均值使得每一列平均值为0。将新的数据组成m*n的矩阵X,其中m代表8个样本街道数,n代表9个步行环境指标。(2)求出X的协方差矩阵covX(里面c1换成x1)(3)求协方差矩阵的特征值λ与特征向量
3、ξ,用来计算每一指标的贡献率与得到n维到k维的映射:Xξ=λξ(ξ上加箭头)由式几点几可以得到n个特征值λ1,…λn与n个特征向量ξ1,ξ2,…,ξn,可以组成一个n维特征值向量l:(l加箭头)l=(λ1,…λn)T与变换矩阵C=(ξ1,ξ2,…,ξn)(4)根据特征值向量,得出新的指标x’i的贡献率ψ’iψ’i=ψ’i/Σψ’i根据贡献率ψi由大到小重排变换矩阵C,选取前k个贡献率大的特征向量ξi,使得其总和超过阈值即可,将其组成新的矩阵C’=[ξ’1,ξ’2,…,ξ’k]由式几点几,通过变换矩
4、阵C’将原有数据矩阵X映射为新的数据矩阵X’:X’=XC=式几点几放到后面步骤:根据变换矩阵C,亦可算出X与X’的权重矩阵Φm×n,其中:φij=
5、cij
6、/Σ
7、c.j
8、由权重矩阵与特征值向量l,可以得出原有指标xi的贡献率ψi有:Ψ=Φl=(ψ1,ψ2,…,ψn)
此文档下载收益归作者所有