欢迎来到天天文库
浏览记录
ID:46690339
大小:488.00 KB
页数:41页
时间:2019-11-26
《数据的描述性分析(袁军》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、4第四章数据的描述性分析通过本章的学习,我们应该知道:描述数据的集中趋势的指标及计算描述数据的离散程度的指标及计算了解数据分布的偏度与峰度利用Excel进行数据的描述性统计分析Statistics本章内容概述1本章内容是关于:单变量截面数据的特征描述2为了对统计分组和简单整理后的数据的进一步认识,借助于下面的四类指标进行深入讨论:集中趋势、离散程度、偏态与峰度3统计指标的作用1集中趋势的描述集中趋势(centraltendency)反映的是一组数据向某一中心值靠拢的倾向。数据的集中趋势通常用平均指标来反映。集中趋势指标(平均指标)按计算方法不同分为
2、:㈠算术平均数㈡调和平均数㈢几何平均数㈣中位数㈤众数数值平均数位置平均数83名女生的身高分布的集中趋势、中心数值算术平均数可以反映现象总体的客观规律性;可以对比同类现象在不同的时间、地点和条件下的一般水平;可以分析现象之间的依存关系。测定集中趋势的意义:1-1算术平均数(arithmeticmean)1概念:算术平均数是分析社会经济现象一般水平和典型特征的最基本指标,是统计中计算平均数最常用的方法。2基本公式:注意:公式中分子和分母在经济内容上的从属关系:公式中分子和分母在范围上是一致的,否则不是平均数例:劳动生产率=粮食产量/种粮农民人数;全国平
3、均每人拥有的粮食产量=粮食产量/全国人口数。简单算术平均数与加权算术平均数简单算术平均数(simplearithmeticmean)特点:适于未分组数列;每个变量值出现的次数都是1。加权算术平均数(weightedarithmeticmean)特点:适于分组数列;平均数的值受权数的影响。计算公式:其中:原始数据分为组,第组变量值为对应的次数为注意:对变量值的说明单项变量数列直接对变量值进行加权平均计算;组距变量数列先求出该组变量值的组中值,作为进行计算。权数(weight)1概念我们把变量数列中的次数看作变量值的权数。原因在于:影响平均数大小的两个
4、因素:变量值大小和权数。2形式权数有两种形式:绝对数形式(频数)、相对数形式(频率)同一总体资料,用权数的两种形式计算的平均数完全相同。X456合计频数频率(%)10201025.050.025.040100.0X456合计频数频率(%)20402025.050.025.080100.0X456合计频数频率(%)20101050.025.025.040100.0成绩(分)人数(人)甲班乙班丙班603915010013950平均成绩(分)619980起到权衡轻重的作用权数对算术平均数的影响决定平均数的变动范围组距数列加权算术平均数计算举例某企业工人日
5、产量的算术平均数计算表(单位:千克)按日产量分组工人数fi组中值xixifi60以下1060~701970~805080~903690~10027100~11014110以上8合计164工人平均日产量=13550/164=82.62(千克)算术平均数的数学性质1算术平均数与总体单位数的乘积等于总体各单位标志值的总和。2各变量值与算术平均数的离差之和等于零。3各变量值与算术平均数的离差平方之和最小。优点:1容易理解,便于计算2灵敏度高缺点:1容易受极端变量值的影响2在开口组中,代表性变差1-2调和平均数(harmonicmean)概念:由于在社会经济
6、统计中缺乏资料,计算平均数时就需要采用间接的方式,于是产生了调和平均数。时间单价(元/斤)x所花钱数(元)m购买量(斤)m/x早市中市晚市0.50.40.2111合计—3购买3次该蔬菜的平均价格是多少?已知分子资料未知分母资料调和平均数与算术平均数的关系调和平均数在实际应用中一般是作为算术平均数的变形使用,区别在于两者所掌握的原始资料不同。对于相同的总体,两者计算得到的结果完全相同。9.253—合计22.2551110.50.40.2早市中市晚市购买量(斤)m/x所花钱数(元)m单价(元/斤)x时间已知资料→调和平均数已知资料→算术平均数调和平均数
7、的特点优点:1灵敏度高2在某些情况下,代替简单平均数进行计算缺点:1不容易理解2容易受极值影响3有标志值为0时,不能计算已知分子资料未知分母资料未知分子资料已知分母资料1-3几何平均数(geometricmean)1概念:若干项变量值连乘积开其项数次方的算术根。当各项变量值的连乘积等于总比率或总速度时,适宜使用他计算平均比率或平均速度。2计算:简单几何平均数:加权几何平均数:3优点:受极端变量值影响小;适宜计算平均比率和平均速度。缺点:有变量值为0或负值不能计算;应用范围较窄。1-4中位数与分位数1概念总体单位标志值按大小顺序排列,处于中间位置的那
8、个标志值就是中位数(median)Me。意义:总体标志值中一半比中位数小,一半比它大。人口普查中应用年龄中位数;产品质量控
此文档下载收益归作者所有