资源描述:
《主成分分析和MATLAB应用经典版,推荐.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、function[pc,score,latent,tsquare]=princomp(x);% PRINCOMPPrincipalComponentAnalysis(centeredandscaleddata).%[PC,SCORE,LATENT,TSQUARE]=PRINCOMP(X)takesadatamatrixXand%returnstheprincipalcomponentsinPC,theso-calledZ-scoresinSCORES,%theeigenvaluesofthec
2、ovariancematrixofXinLATENT,andHotelling's%T-squaredstatisticforeachdatapointinTSQUARE.%Reference:J.EdwardJackson,AUser'sGuidetoPrincipalComponents%JohnWiley&Sons,Inc.1991pp.1-25.%B.Jones3-17-94%Copyright1993-2002TheMathWorks,Inc.%$Revision:2.9$$Date:
3、2002/01/1721:31:45$[m,n]=size(x);%得到矩阵的规模,m行,n列r=min(m-1,n);%maxpossiblerankofx%该矩阵最大的秩不能超过列数,%也不能超过行数减1avg=mean(x);%求每一列的均值,付给一个n维行向量centerx=(x-avg(ones(m,1),:));%x的每个元素减去该列的均值,%使样本点集合重心与坐标原点重合[U,latent,pc]=svd(centerx./sqrt(m-1),0);%“经济型”的奇异值分解scor
4、e=centerx*pc;%得分矩阵即为原始矩阵乘主成分矩阵ifnargout<3,return;endlatent=diag(latent).^2;%将奇异值矩阵转化为一个向量if(r5、tlab版]functionmain()%*************主成份分析************%读入文件数据X=load('data.txt');%==========方法1:求标准化后的协差矩阵,再求特征根和特征向量=================%标准化处理[p,n]=size(X);forj=1:n mju(j)=mean(X(:,j)); sigma(j)=sqrt(cov(X(:,j)));endfori=1:p forj=1:n Y(i,j)=(X(
6、i,j)-mju(j))/sigma(j); endendsigmaY=cov(Y);%求X标准化的协差矩阵的特征根和特征向量[T,lambda]=eig(sigmaY);disp('特征根(由小到大):');disp(lambda);disp('特征向量:');disp(T);%方差贡献率;累计方差贡献率Xsum=sum(sum(lambda,2),1);fori=1:n fai(i)=lambda(i,i)/Xsum;endfori=1:n psai(i)=sum(sum(lam
7、bda(1:i,1:i),2),1)/Xsum;enddisp('方差贡献率:');disp(fai);disp('累计方差贡献率:');disp(psai);%综合评价....略%+============方法2:求X的相关系数矩阵,再求特征根和特征向量================%X的标准化的协方差矩阵就是X的相关系数矩阵R=corrcoef(X);%求X相关系数矩阵的特征根和特征向量[TR,lambdaR]=eig(R);disp('特征根(由小到大):');disp(lambdaR)
8、;disp('特征向量:');disp(TR);主成分分析类型:一种处理高维数据的方法。降维思想:在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决