欢迎来到天天文库
浏览记录
ID:18863661
大小:209.90 KB
页数:16页
时间:2018-09-26
《原创 数据分析课程设计——主成分分析论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、**大学数据分析课程设计论文题目:我国各省市自治区社会发展的综合状况指标分析学院:专业:姓名:学号:-16-我国各省市自治区社会发展的综合状况指标分析摘要一个地区的全面发展必须使经济和社会协调发展。为了全面衡量社会发展水平,有必要选择一套能反映社会发展的有代表性的社会指标进行综合评价,对每个地区的社会发展水平进行测量分析,我们根据各地区统计指标,选择了有代表性的社会经济指标,包括城镇居民可支配收入、农村居民可支配收入、在校学生数、学校数、卫生机构数、固定资产投资总额等方面数据进行综合考察,利用主成分分析方法对各地区综合发展状况进行评价。论文中主要运用的方法是主成份分析法。主成份分析法的目
2、的是利用降维的思想,把多指标转化为少数几个综合指标。分析出主成分后,对数据进行综合排名,能较直观的反应社会发展的综合状况,便于分析各省市自治区的社会发展情况和影响因素。关键词:各省自治区社会发展综合状况指标主成分分析排名-16-目录一、问题的提出…………………………………………………4二、基于主成份分析的社会发展综合状况指标的筛选2.1原理概述…………………………………………………………42.1.1主成分分析的一般数学模型…………………………42.1.2主成分分析确定的一般原则…………………………52.1.3主成分分析的基本步骤………………………………52.1.4主成分分析得到的主成分与
3、原始变量之间的关系…52.2原始数据及来源…………………………………………………62.3对指标的主成分分析及筛选…………………………………72.3.1操作过程………………………………………………72.3.2实验结果输出………………………………………82.3.3实验结果分析………………………………………12三、总结…………………………………………………………14参考文献……………………………………………………………16附录…………………………………………………………………16-16-第一章问题的提出中国的经济和社会的发展如何让才能踏上一条内外和谐、全面增长的稳健之路,不但攸关中国自身的利益
4、,也成为举世瞩目的焦点。本文根据各省的社会发展指标,将全国主要省份社会实力进行排名,从而可以为政府决策部门对社会的发展规划提供一定的依据。日后通过政府政策的调整,各省再发挥各自优势力量,抓住机遇,社会全发张和可持续发展能力一定会进一步提高。社会发展状况评价的难点在于反映社会发展的指标众多,每一项指标又会从不同视角反映社会发展状况。所以,依据他们作综合评价有一定难度。我们可以看到,成份分析法的目的是利用降维的思想,把多指标转化为少数几个综合指标,从而很好地解决了这一问题。第二章基于主成份分析的社会发展综合状况指标的筛选2.1原理概述主成分分析是考察多个定量(数值)变量间相关性的一种多元统计
5、方法。它是研究如何通过少数几个主分量(即原始变量线性组合)来解释多变量的方差——协方差结构。具体地说,是导出少数几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间不相关。主成分分析常被庸吏寻找判断某种事物或现象的综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地解释事物内在的规律。2.1.1主成分分析的一般数学模型假设有n个样本,每个样本测得p项指标(p6、间不相关,这就成为一个重要的问题。怎么解决这个问题,主成分分析给出了最好的方法。如果记原来的变量指标为,它们的综合指标——新变量指标为,(m≤p)。则-16-在(2)式中,系数lij由下列原则来决定:(1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。其7、中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。
6、间不相关,这就成为一个重要的问题。怎么解决这个问题,主成分分析给出了最好的方法。如果记原来的变量指标为,它们的综合指标——新变量指标为,(m≤p)。则-16-在(2)式中,系数lij由下列原则来决定:(1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。其
7、中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。
此文档下载收益归作者所有