欢迎来到天天文库
浏览记录
ID:12824650
大小:727.50 KB
页数:0页
时间:2018-07-19
《城镇单位就业人员平均工资统计分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、城镇单位就业人员平均工资统计分析——关于各地区按行业分就业人员工资分析数学与财经学院统计专业2010级统计班周浩指导教师:杨春华摘要:本文对各地区按行业分城镇单位就业人员平均工资指标进行分析,数据来自《中国统计年鉴2013年》,记录了31个省、市、自治区19个行业城镇单位2012年就业人员平均工资数据,本文对共589个数据进行统计分析。采用描述性统计、聚类分析、主成分分析统计方法,将31个地区的工资水平分为3类,查找出影响分类的公共因子是金融业和新兴行业的工资水平,传统行业的影响力远小于其他行业。结果显示,北京和上海是全国工资水平最高
2、的地区,行业发展平衡,沿海城市和直辖市平均工资水平普遍好于其他内陆地区,内陆地区行业发展不突出,工资水平低,甘肃和山西排在最末尾。关键词:工资;描述性分析;聚类分析;主成分分析1.引言及理论方法1.1前言改革开放以来,我国经济飞速发展,各行业的发展也可谓势如破竹,新兴行业的兴起,伴随着夕阳行业的衰落,这也引起了各行业发展不平衡。一个城市的发展离不开行业的发展,单个行业的发展不能支撑起城市的发展,各个行业的发展才能真正让城市更具有竞争力。众所周知,越来越多的求职者将目光抛向了我国一线、二线城市的热门行业,造成了供求关系的不平衡,这也导致
3、大部分求职者的失业,同时也造成其它城市的行业发展不平衡。我认为造成各行业发展不平衡的一个重要原因是各行业工资水平参差不齐,同时工资水平也是体现一个行业发展的重要指标,可见研究工资水平的意义重大。无论现在科技多发达,每个行业都需要劳动者的支持,而工资水平则与劳动者有直接的关系,利润决定分配,只有经济发展才能提供更多的可分配的社会产品,因此工资水平必须与经济发展水平相适应。总而言之,分析各地区各行业的就业人员工资就变得十分具有现实意义以及可研究性。本文均采用真实数据,对31个省、市、自治区19个行业城镇单位就业人员平均工资进行统计分析。目
4、的是根据各行业平均工资指标,采用统计方法,进行分类以区分地区间的工资水平,再结合该地区该行业的发展情况及需求情况,提出该地区该行业平均工资的调整建议,促进各地区和各行业共同发展。1.2统计分析理论方法1.2.1描述性统计从所给数据中计算出均值、方差、标准差、最大/小值、偏度、峰度等统计量,并以图形为辅助,掌握数据的基本特征和整体的分布特点。1.2.2聚类分析聚类分析的核心思想是,从一批样品的多个观测指标变量中,定义能度量样品间相似程度的统计量,在此基础上求出样品间相似程度度量值,按照相似程度的大小将样品进行归类。关系密切的聚集到一个小
5、的分类单位,关系大的聚集到一个大的分类单位,直到所有的样品都聚集完毕(成一类)[1]。聚类分析关注于根据一些不同种类的度量构造一些相似的对象组成的群体。关键的思想去确定对分析目标有利的对象分类方法。聚类分析依据的基本原则是:直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。其中欧式距离在聚类分析中用得最广,它的表达式如下:其中表示第个样品的第个指标的观测值,表示第个样品的第个指标的观测值,为第个样品与第个样品之间的欧氏距离。若越小,
6、那么第与两个样品之间的性质就越接近。性质接近的样品就可以划为一类。1.2.3主成分分析主成分分析所做的工作就是将原来众多并且相关的变量,重新组合为一组新的无关联性的综合变量来代替原来变量。一般来说,处理方法就是将原来的变量做线性组合,作为新的综合变量,但是这种方法造成组合如果不加以限制,则可以有很多,那该怎么选择呢?如果将选取的第一个线性组合记为,即第一个综合变量,当然希望它尽可能多地反映原始变量的信息,这里“信息”用方差来测量,即希望越大,表示包含的信息越多。因此在所有的线性组合中所选取的应该是方差最大的,故称为第一主成分。如果第一
7、主成分不足以代表原来个变量的信息,再考虑选取即第二个线性组合,为了有效地反映原来信息,已有的信息就不需要再出现在中,用数学语言表达就是要求,称为第二主成分,依此类推可以构造出第三、四……第个主成分[3]。它的数学模型如下:1.原始指标数据的标准化采集维随机向量个样品,,,构造样本阵,对样本阵元进行如下标准化变换:其中,,得标准化阵Z。2.对标准化阵Z求相关系数矩阵其中,。3.解样本相关矩阵的特征方程得个特征根,对个特征根进行排序,使信息的利用率达80%以上,确定主成分按确定值,,对每个,解方程组得单位特征向量。4.将标准化后的指标变量
8、转换为主成分称为第一主成分,称为第二主成分,…,称为第主成分。5.对个主成分进行综合评价对个主成分进行加权求和,即得最终评价值,权数为每个主成分的方差贡献率。1.3数据描述本数据来自《中国统计年鉴2013年》,记录了20
此文档下载收益归作者所有