资源描述:
《基于多元统计的居民消费水平评价模型及应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第39卷第20期数学的实践与认识Vol139No1202009年10月MATHEMATICSINPRACTICEANDTHEORYOctober,2009基于多元统计的居民消费水平评价模型及应用112马志明,耿生玲,尚次(1.青海师范大学计算机系,青海西宁810008)(2.青海省统计局信息中心,青海西宁810008)摘要:为解决传统主成分分析在消费水平评价应用中的局限性,对传统主成分方法作了改进,建立一种新的评价模型,利用此模型对青海城镇居民消费水平进行评价.结果表明:这是一种适合于居民消费水平综合定量评价且切实有效的方法模型,有较强的实践价值.关键词:主成分分析;城镇居
2、民;消费支出0引言在我们对多元数据进行分析处理时,由于研究对象有多项指标,而且由于指标彼此之间存在着一定程度的相关性,各指标提供的信息相互交织重叠,这不仅影响我们对总体信息的认识与评价,也使问题分析变得更加困难.面对这一困难的解决思路是对相关数据进行某种形式的综合处理,用一项或较少几项不相关的综合指标来反映总体信息,主成份分析是这一思想的具体体现.主成份分析(PrincipleComponentAnalysis,简称PCA)由皮尔逊(pearson,1901)首先提出,并由霍特林(Hotelling,1933)等人发扬光大,是一种通过降维方法把多项相关指标化为少数几个不相关
3、的综合指标(即主成份)的多元数据处理技术.目前,进行居民消费水平综合评价的方法主要是利用多元统计中的主成分分析(PCA)[1]方法,PCA方法在综合评价应用中有其局限性,且各指标提供的信息相互交织重叠,影响[2]了对总体信息的认识与评价,极大限制了它在居民消费水平综合评价方面的进一步应用.本文针对这些局限性,对传统主成分分析方法进行改进,建立一种新的评价模型,并以综合指数形式实现居民消费水平的量化评价,具有一定的理论及实践价值.1传统主成分分析的基本思想方法已知p维评价样本,对n个样本点的同方向规格化变量记作:x1,x2,⋯,xp.PCA经过线性变换,以少数新的综合变量(即
4、主成分)取代原来的变量,R=(Rij)p×p为相关系数矩阵.K1EK2E⋯EKpE0为R的特征根,e1,e2,⋯,ep是对应的单位化正交特征向量,则第i个主成分为:fi=ei1x1+ei2x2+⋯+eipxp(1)再以方差贡献率Ai为权,对各主成分加权合成最终评价指标F,即:mmmF=A1f1+A2f2+⋯Amfm=∑ei1Aix1+∑ei2Aix2+⋯+∑eipAixp(2)i=1i=1i=1收稿日期:2009203211基金项目:青海省基础研究与软科学计划基金(20072Z2613)20期马志明,等:基于多元统计的居民消费水平评价模型及应用49mmpm的取法是累积方差贡
5、献率∑Ai=∑Kiö∑Kk达到一定比率(一般E85%).将规格化数据i=1i=1k=1分别代入各主成分的表达式中,计算得样本的各主成分得分,以方差贡献率为权数求和得综合得分,它就是对样本点的定量化评价值.以上即为传统PCA方法应用所常用的方差贡献率评价模型,也是目前居民消费水平评价PCA的普遍应用模型.传统主成分分析方法在居民消费水平评价应用中的局限性.第一标准化变换存在缺陷.主成分分析应用中规格化时常用的方法是标准化变换,标准化变换的缺陷在于:它使各指标变量方差都变为1,在消除量纲的同时,亦消除了各指标变量变异程度上的差异信息,不能准确反映居民消费支出指标中包含的全部信息
6、,也直接影响方法的降维效果.第二信息量权的缺陷.PCA用于多指标评价的传统方法是利用原始指标数据所包含的方差大小来对主成分施行客观赋权,没有考虑到评价指标的重复影响,如果一个指标与其它指标的信息重复量越大,这个指标在整个指标集中的作用越小.第三PCA方法在应用中最佳效果是(2)式中的m取1,即只取第一主成分f1,在某种程度上,(2)式可以理解为是对第一主成分作为水平因子失败的一种补救方法,直接使用(2)式会出现偏差,为了解决这个问题需要在方差贡献率第一次加权求和后,利用相关分析,将指标与其它指标的相关关系作为第二次加权权数,从而得到更为合理的综合评价指标.2基于多元统计的改
7、进主成分分析算法2.1数据的均值化为了消除变量量纲和数量级的影响,又能反映原始数据的变异信息,将各指标的均值除相应的原始数据.设原始数据:X=(xij)n×p,令3xijxij=q,i=1,2,⋯,p(3)xjnq133其中,xj=∑xkj,j=1,2,⋯,p,得均值化数据阵X=(xij)n×p.nk=1[3]由文可知,均值化不改变各指标间的相关系数,相关系数矩阵全部信息都在相应的协方差阵中得到反映.32.2计算X的相关系数矩阵,及特征值,特征向量,方差贡献率2.3确定主成分个数及主成分的表达式2.4构造综合评价函