欢迎来到天天文库
浏览记录
ID:61784557
大小:1.02 MB
页数:69页
时间:2021-03-20
《数学建模实用教程(主成分分析).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、综合评价方法之二基于数据分析几种方案方案一主成份分析法问题实际背景在现实生活中,人们往往会对样品收集尽可能多的指标,例如人口普查往往要调查每个人的姓名、年龄、性别、文化程度、住房、职业、收入、消费等几十项指标,从收集资料的角度来看,收集较多的数据有利于完整反映样品的特征,但是这些指标从统计角度来看相互之间具有一定的依赖关系,从而使所观测的数据在反映信息上有一定重叠。解决的问题之一:降维主成份分析正是针对这类问题而产生的,是解决这类题的理想工具。主成分分析也称主分量分析(principalcomponentsa
2、nalysis,PCA)是由美国的科学家哈罗德·霍特林(HaroldHotelling)于1933年首先提出的。人们希望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种“降维”的思想。多维数据的一种图形表示方法。我们知道当维数大于3时便不能画出几何图形经过主成分分析后,我们可以选取前两个主成分或其中某两个主成分,这样既可以就这两个主成分性质加以分析,还可以根据主成分画出n个样品在二维平面上的分布况,由图形可直观地看出各样品在主成分中的地位,进而还
3、可以对样本进行分类处理。解决的问题之二:几何分析选择评价指标体系后通过对各指标加权的办法来进行综合。但是,如何对指标加权是一项具有挑战性的工作。指标加权的依据是指标的重要性,指标在评价中的重要性判断难免带有一定的主观性,这影响了综合评价的客观性和准确性。主成分分析法是根据指标间的相对重要性进行客观加权,可以避免综合评价者的主观影响,所以在实际应用中越来越受到人们的重视。解决的问题之三:客观加权有关数学模型与常见实例2008年美国数学建模竞赛题:“评价国家公共卫生体系上的应用”啤酒风味评价分析实例我国部分地区城镇居
4、民家庭收支基本情况分析实例主成分分析的基本思想明确信息量大数学意义我们知道,当一个变量只取一个数据时,这个变量(数据)提供的信息量是非常有限的,当这个变量取一系列不同数据时,我们可以从中读出最大值、最小值、平均数等信息。变量的变异性越大,说明它对各种场景的“遍历性”越强,提供的信息就更加充分,信息量就越大。主成分分析中的信息,就是指标的变异性,用标准差或方差表示它。为了便于理解以两个指标为例:主成分确定的准则:信息损失小,之间重叠少假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系x1-O-x2中
5、,观察散点的分布,单独看这n个点的分量X1和X2,它们沿着x1方向和x2方向都具有较大的离散性,其离散的程度可以分别用的X1方差和X2的方差测定。如果仅考虑X1或X2中的任何一个分量,那么包含在另一分量中的信息将会损失,因此,直接舍弃某个分量不是“确定主成分”的有效办法。确定第一主成分方法事实上,散点的分布总有可能沿着某一个方向略显扩张,这个方向就把它看作椭圆的长轴方向。结论:为第一主成分,为第二主成分。主成分的数学模型:推广一般主成分确定的模型主成分分析的数学模型是,设p个变量构成的q维随机向量为X=(X1,…
6、,Xp)′对X作正交变换,令Y=T′X,其中T为正交阵,要求Y的各分量是不相关的,并且Y的第一个分量的方差是最大的,第二个分量的方差次之,……,等等。为了保持信息不丢失,Y的各分量方差和与X的各分量方差和相等。Y是列向量T为正交阵有:T’T=I;T’=T^(-1)新旧变量关系的表达式新指标的方差及它们的协方差:其中表示方差,Cov表示协方差,表示X协方差阵主成分确定条件:第一主成分为,满足,并且使得达到最大的。第二主成分为,满足,使得达到最大的。一般情形,第主成分为,满足,且(),使得达到最大的。第一主成分求法第
7、二主成分求法第主成分求法结论:主成分保持信息总量不少主成分个数确定的标准第个主成分的贡献率:主成分个数确定的标准主成分分析的步骤构造样本阵样本阵,其中是样本容量即评价对象,是评价指标个数,是第个样本中采集的第项评价指标值。指标正向化正向指标是随着该指标值的增长总系统评价结果越好,因而转化公式为转化后样本阵指标规范化为克服单位差异对评价结果的影响,须将指标规范化其中,协方差矩阵:也是样本阵的相关系数阵显然,的协方差矩阵也是的相关系数矩阵确定主成分构造综合评价函数1.求的权值公式:2.构造综合评价函数这里我们应该注意
8、,从本质上说综合评价函数是对原始指标的线性综合,从计算主成分到对之加权,经过两次线性运算后得到综合评价函数。啤酒风味评价实例分析题目:啤酒是个多指标风味食品,为了全面了解啤酒的风味,啤酒企业开发了大量的检测方法用于分析啤酒的指标,但是面对大量的指标数据,大多数企业又感到茫然,不知道如何利用这些大量的数据,来对各品牌的啤酒加以评价,由上面的介绍可知,在这种情况下,主成分分析
此文档下载收益归作者所有