数学建模案例分析—主成分分析的应用--概率统计方法建模

数学建模案例分析—主成分分析的应用--概率统计方法建模

ID:44869052

大小:209.00 KB

页数:4页

时间:2019-10-31

数学建模案例分析—主成分分析的应用--概率统计方法建模_第1页
数学建模案例分析—主成分分析的应用--概率统计方法建模_第2页
数学建模案例分析—主成分分析的应用--概率统计方法建模_第3页
数学建模案例分析—主成分分析的应用--概率统计方法建模_第4页
资源描述:

《数学建模案例分析—主成分分析的应用--概率统计方法建模》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、§8主成分分析的应用主成分分析的基本思想是通过构造原变量的适当的线性组合,以产生一系列互不相关的新变量,从中选出少数几个新变量并使它们尽可能多地包含原变量的信息(降维),从而使得用这几个新变量替代原变量分析问题成为可能。即在尽可能少丢失信息的前提下从所研究的个变量中求出几个新变量,它们能综合原有变量的信息,相互之间又尽可能不含重复信息,用这几个新变量进行统计分析(例如回归分析、判别分析、聚类分析等等)仍能达到我们的目的。设有个样品,个变量(指标)的数据矩阵寻找个新变量,使得1、2、彼此不相关这便是

2、主成分分析。主成分的系数向量的分量刻划出第个变量关于第个主成分的重要性。可以证明,若为维随机向量,它的协方差矩阵的个特征值为,相应的标准正交化的特征向量为,则的第主成分为。称为主成分的贡献率,为主成分的累计贡献率,它表达了前个主成分中包含原变量的信息量大小,通常取使累计贡献率在85%以上即可。当然这不是一个绝对不变的标准,可以根据实际效果作取舍,例如当后面几个主成分的贡献率较接近时,只选取其中一个就不公平了,若都选入又达不到简化变量的目的,那时常常将它们一同割舍。计算步骤如下:1、由已知的原始数据

3、矩阵计算样本均值向量;其中2、计算样本协方差矩阵其中3、把原始数据标准化,即,记。形成样本相关矩阵;4、求的特征根及相应的标准正交化的特征向量,可得主成分为。关于主成分的实际意义,要结合具体问题和相关的专业知识才能给出合理的解释。例1下表是10名初中男学生的身高(),胸围(),体重()的数据,试进行主成分分析。身高()/cm胸围()/cm体重()/kg149.569.538.5162.577.055.5162.778.550.8162.287.565.5156.574.549.0156.174.5

4、45.5172.076.551.0173.281.559.5159.574.543.5157.779.053.5由表中数据计算得到解出的三个特征值和相应的三个标准正交化的特征向量为,,由于三个主成分的贡献率分别为当保留前两个主成分时,累计贡献率已达98.86%,因此第三个主成分可以舍去。得到的前两个样本主成分的表达式为现在我们来解释这两个主成分的意义,从的表达式可以看出,是身高、胸围、体重三个变量的加权和,当一个学生的数值较大时,可以推断其或较高或较胖或又高又胖,故是反映学生身材魁梧与否的综合指标

5、。的表达式中系数的符号为一正()两负(,),当一个学生的数值较大时,表明其大,而,小,即为瘦高个,故是反映学生体形特征的综合指标。需要指出的是,虽然利用主成分本身可对所涉及的变量之间的关系在一定程度上作分析,但这往往并不意味着分析问题的结束。主成分分析本身往往并不是最终目的,而只是达到某种目的的一种手段。很多情况下,主成分分析只是作为对原问题进行统计分析的中间步骤,目的是利用主成分变量代替原变量作进一步的统计分析,达到减少变量个数的效果。例如,利用主成分变量作回归分析、判别分析、聚类分析等等。下面

6、再举一个利用主成分进行样品排序的例子。例2电子工业部所属的15个工厂某年份的经济效益数据如下表。其中—资金利税率(%)—固定资产利税率(%)—流动资金利税率(%)—全员利税率(%)—成本利税率(%)—流动资金周转天数厂序经济效益排序值1234567891069.87269.1094.38115.7423.857466.31260.0089.0193.3040.098067.26272.5489.2978.9026.708468.46250.1894.2476.8724.981839.45146.1

7、754.0490.9517.4610924.82116.8631.5181.5910.4211730.2173.6051.2339.5231.0622731.24168.3138.3762.1614.2912923.29109.4229.5929.678.239923.1092.4130.8043.5712.48136(1)(2)(3)(4)(5)(6)(8)(7)(9)(10)0.7850.7270.6720.6340.2060.029-0.083-0.050-0.170-0.196111213

8、141518.9557.6328.2421.9117.232318.6521.7114.359.638.261775.1027.276.388.606.462394.6618.426.248.594.542311.929.282.423.339.67135(11)(12)(13)(15)(14)-0.32-0.51-0.55-0.66-0.64按照上述步骤,可以计算出样本相关矩阵为的特征根及相应的标准正交化的特征向量分别为特征向量累计贡献率(%)5.03900.62300.1030

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。