资源描述:
《应用经济统计学数据整理与分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据整理与分析主要内容数据分组数据显示数据集中趁势数据离中趋势数据分组1、将原始资料顺序排序2、确定组数与组距3、确定组限4、将各个数据按其数值大小归入相应的组内如果数据分布比较均匀、对称,即中间数值次数多,大小极端值次数少,考虑用以下公式来确定组数:组数=1+3.322logn组距=(观察值中的最大数值-观察值中的最小数值)/组数数据分组例【例1】设某企业30个非熟练工人的周工资额(元)如下:1069985121849410611011910195918710510610911896128911
2、05111111107103101107106数据分组例排序:84,85,87,91,91,94,95,96,97,99,101,101,103,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128分组计算组数=1+3.322logn=5.9(n=30)分6组组距:每组区间的宽度=(观察值中的最大数值-观察值中的最小数值)/组数=(128-84)/6=7.3分6组,组距8每周工资(元)人数(个)各组人数占总人
3、数百分比(%)84~9251792~100517100~1081240108~116413116~124310124~13213合计30100结合实际数据一、比较计算组距值(7.3),组距为10比较好计算且方便,二、分组的组数相应从6减少为5。最小值为84,下限从80开始,分5组,组距10每周工资(元)人数(个)各组人数占总人数百分比(%)80~9031090~100723100~1101343110~120517120~13027合计30100分两组工资收入次数分配表工资收入分组次数80-105
4、13105-13017合计30反映不出观察值分布特征分组太细会出现什么问题?数据图示直方图:频数分配直方图、频率分配直方图次数多边形图累积次数分配图:小于上组限的累积次数分配图、大于下组限的累积次数分配图。[特例]洛伦茨曲线茎叶图直方图以变量值为横坐标、次数为纵坐标,以矩形高度表示各组次数(频数)分配多少。如下图:频数直方图直方图频率分布直方图次数多边形图次数多边形图还可将几种不同数据绘在同一多边形图上用于比较.如图:累计次数分配图小于上组限的累积次数分配每周工资(元)上组限组次数小于上组限的累计
5、次数(人)小于上组限的累积百分比(%)80~9090331090~10010071033100~110110132377110~12012052893120~130130230100累计次数分配图以变量值为横坐标、以累积计次数为纵坐标描点连接而成的图,如下图:累计次数分配图大于下组限的累积次数分配每周工资(元)上组限组次数小于上组限的累计次数(人)小于上组限的累积百分比(%)80~908033010090~1009072790100~110100132066110~1201105723120~13
6、0120227累计次数分配图洛伦茨曲线以人口百分比为横坐标、以累积收入百分比为纵坐标描点连接而成的图形,如图:基尼系数反映一国收入的平等程度。如右图基尼系数r=A/(A+B)r=0绝对平等r=1绝对不平等r越大越不平等,反之则越平等。茎叶图数据源:21,29,60,1,27,35,66,23,8,38,31,45,57,66,68,62,62,93,68,19,68,72,76,91,46,62,3,10,49,56,52,95按大小排序后如下:1,3,8,10,19,21,23,27,29,31
7、,35,38,45,46,49,52,56,57,60,62,62,62,66,66,68,68,68,72,76,91,93,95茎叶图茎叶次数01383109221379431583456935267360222668889726280913554数据集中趋势算术平均数几何平均数调和平均数中位数及四分位数众数算术平均数(概念要点)集中趋势的测度值之一最常用的测度值一组数据的均衡点所在易受极端值的影响算术平均数(计算公式)设一组数据为:简单算术平均值的计算公式为设分组后的数据为:相应的频数为:加
8、权算术平均值的计算公式为简单算术平均数(算例)原始数据:10591368加权算术平均数(算例)【例2】设某企业经理付给他的雇员的每小时工资分为三个等级:6.5元、7.5元、8.5元。拿这三种工资的人数分别为:14人、10人、2人,则该公司雇员的平均工资为:加权算术平均数(分组数据算例)表4-1某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(fi)Xifi105~110110~115115~120120~125125~130130~135135~140107.51