MATLAB数据分析方法 ppt课件.ppt

MATLAB数据分析方法 ppt课件.ppt

ID:59416496

大小:922.50 KB

页数:84页

时间:2020-09-19

MATLAB数据分析方法 ppt课件.ppt_第1页
MATLAB数据分析方法 ppt课件.ppt_第2页
MATLAB数据分析方法 ppt课件.ppt_第3页
MATLAB数据分析方法 ppt课件.ppt_第4页
MATLAB数据分析方法 ppt课件.ppt_第5页
MATLAB数据分析方法 ppt课件.ppt_第6页
MATLAB数据分析方法 ppt课件.ppt_第7页
MATLAB数据分析方法 ppt课件.ppt_第8页
MATLAB数据分析方法 ppt课件.ppt_第9页
MATLAB数据分析方法 ppt课件.ppt_第10页
资源描述:

《MATLAB数据分析方法 ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、普通高等院校计算机课程规划教材MATLAB数据分析方法李柏年吴礼斌主编张孔生丁华参编第5章主成分与典型相关分析主成分分析就是将原来指标重新组合成一组新的互相无关的指标来代替原来指标.这些综合指标就是原来指标的线性组合,同时根据实际需要从中选取几个较少的综合指标尽可能多地反映原来指标的信息.5.1主成分分析的基本原理1.基本思想主成分分析是一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法

2、就叫做主成分分析或主分量分析。2.主成分的数学模型设X1,X2,…Xp,为实际问题的p个n维随机变量(p项指标)记X=(X1,X2,…,Xp)T,其协方差矩阵为它是一个p阶的非负定矩阵。设变量x1,x2,…xp经过线性变换后得到新的综合变量Y1,Y2,…,Yp,即或(5.1.1)其中系数为常数向量。要求(5.1.1)满足以下条件:(1)系数向量是单位向量,即(2)不同的主成分不相关,即(3)各主成分的方差递减,即(5.1.2)(5.1.3)(5.1.4)于是,称Y1为第一主成分,Y2为第二主成分,依此类推,Yp称为第p个

3、主成分。主成分又叫主分量。这里lij我们称为主成分的系数。3.主成分的求法及性质当总体X=(X1,X2,…,Xp)T的协方差矩阵=(ij)p已知时,我们可根据下面的定理求出主成分。定理5.1设p维随机向量X的协方差矩阵的特征值满足12…p0,相应的单位正交特征向量为e1,e2,…,ep,则X的第i个主成分为(5.1.5)其中,且(5.1.6)证明:令,则P为正交矩阵,且若为X的第一主成分,其中,令则,且只有当h1=(1,0,…,0)(标准单位向量)时等号成立,这时因此,X的第1个主成分为:且方差Var

4、(Y1)=1,达到最大.若为X的第二主成分,其中,且则,且从而只有当h2=(0,1,…,0)=2时等号成立,这时因此的第2个主成分为:且方差Var(Y2)=2,达到最大.类似可得其余主成分的表达式,且各主成份的方差等于相应的特征值.定理5.1表明:求X的主成分等价于求它的协方差矩阵的所有特征值及相应的正交单位化特征向量.推论:若记Y=(Y1,Y2,…,Yp)T为主成分向量,矩阵p=(e1,e2,…,ep),则Y=pTX,且Y的协方差主成分的总方差证明:由(5.1.5)式,显然有Y=PTX,又由(5.1.6)式,有又

5、因为此性质表明主成分分析是将p个原始变量的总方差分解为p个不相关变量Y1,Y2,…,Yp的方差之和.由于Var(Yk)=k,因此描述了第k个主成分提取的信息占总信息的份额.我们称为第个主成分的贡献率,他表示第个主成分提取的信息占总信息的百分比.称前m个主成分的贡献率之和为累计贡献率,它表示前m个主成分综合提供总信息的程度.通常m

6、主成分表达式的系数结合定性分析来进行的。在MATLAB中,运用协方差矩阵进行主成分分析的命令pcacov,调用格式:①PC=pcacov(X)②[PC,latent,explained]=pcacov(X)我们称Yi与Xj的相关系数为因子载荷量,由于因子载荷量与主成分的系数向量成正比,与标准差成反比,因此因子载荷量的绝对值大小刻画了该主成分的成因,可以解释第j个变量对第i个主成分的重要程度.其中输入X是定理5.1中的协方差矩阵,输出PC为定理5.1中的矩阵P,latent是协方差矩阵的从大到小排列的特征值向量,expla

7、ined表示贡献率向量即每个每个主成份的方差在观测量总方差中所占的百分数向量。例5.1.1设随机向量X=(X1,X2,X3)T的协方差矩阵为求X的各主成份以及各主成份的贡献率。clearS=[2,2,-2;2,5,-4;-2,-4,5];%S表示总体的协方差矩阵[PC,vary,explained]=pcacov(S)%总体主成分分析解:因为已知总体的协方差矩阵,所以可调用主成分分析的命令pcacov,程序如下:程序输出结果:PC=-0.333300.9428-0.66670.7071-0.23570.66670.707

8、10.2357%主成份变换矩阵vary=10.00001.00001.0000%主成份方差向量explained=83.33338.33338.3333%各主成份贡献率向量由程序输出结果以及公式(5.1.5)知,X的主成份为:主成份的方差第一主成份的贡献率前俩个主成份的累计贡献率为83.3333%+8.3333%=9

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。