24章 数据特征的测度

24章 数据特征的测度

ID:10871992

大小:60.00 KB

页数:9页

时间:2018-07-08

24章 数据特征的测度_第1页
24章 数据特征的测度_第2页
24章 数据特征的测度_第3页
24章 数据特征的测度_第4页
24章 数据特征的测度_第5页
资源描述:

《24章 数据特征的测度》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、对统计数据特征的测度,主要从三个方面进行:(1)分布的集中趋势;(2)分布的离散程度:(3)分布的偏态和峰度一、集中趋势的测度集中趋势的测度,主要包括位置平均数和数值平均数。位置平均数是指按数据的大小顺序或出现频数的多少确定的集中趋势的代表值,主要有众数、中位数等;数值平均数是指根据全部数据计算出来的平均数,主要有算术平均数、几何平均数等。(一)众数一组数据中出现频数最多的那个数值,用M0表示。用众数反映集中趋势,不仅适用于品质数据,也适用于数值型数据。众数是一个位置代表值,不受极端值的影响,抗干扰性强。(二)中位数把一组数据按从小到大的

2、顺序进行排列,位置居中的数值叫做中位数,用表示。根据未分组数据计算中位数时:(1)对数据进行排序;(2)确定中位数的位置,其公式为:中位数位置=;(3)确定中位数的具体数值。当n为奇数时:当n为偶数时:中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据。中位数也是一个位置代表值,不受极端值的影响,抗干扰性强。【例题·单选题】下面是抽样调查的l0个家庭住房面积(单位:平方米):55757575909298105120150这10个家庭住房面积的众数为( )。A.91B.75C.90D.150『正确答案』B(三)算术平均数全部数据

3、的算术平均,又称均值,用表示。算术平均数是集中趋势最主要的测度值。它主要适用于数值型数据,但不适用于品质数据。1.简单算术平均数主要用于处理未分组的原始数据。【例题·单选题】(2007年)某连锁超市6个分店的职工人数有小到大排序后为57人、58人、58人、60人、63人、70人,其算术平均数、众数分别为( )。A.59、58B.61、58C.61、59D.61、70『正确答案』B『答案解析』算术平均数=(57+58+58+60+63+70)/6=61;众数为58。2.加权算术平均数主要用于处理经分组整理的数据。(组中值与频数的乘积之和,除

4、以各组频数之和,即以各组的频数作为权数)计算时先计算组中值,之后再计算加权算术平均数。计算和运用算术平均数须注意:(1)算术平均数同时受到两个因素的影响:各组数值的大小;各组分布频数的多少。(2)算术平均数易受极端的影响。(四)几何平均数n个观察值连乘积的n次方根就是几何平均数。简单的几何平均数的计算公式熟悉几何平均数的主要用途:(1)对比率、指数等进行平均;(2)计算平均发展速度。集中趋势的测度总结类型具体指标与极端值的关系与数据类型的关系位置平均数众数不受极端值影响既适用于品质数据,也适用于数值型数据中位数 不适用于分类数据数值平均数

5、算术平均数受极端值影响适用于数值型数据,但不适用于品质数据几何平均数适用于观察值之间存在连乘积关系的数值型数据【例题1·单选题】一组数据向某一中心值靠拢的倾向称为( )。A.集中趋势B.离散程度C.偏态D.峰度『正确答案』A【例题2·单选题】(2004年)以下属于位置平均数的是( )。A.几何平均数B.算术平均数C.众数D.极差『正确答案』C【例题3·单选题】一组数据中出现频数最多的那个数值称为( )。A.中位数B.极值C.众数D.平均数『正确答案』C【例题4·单选题】(2005、2006年、2007年)下列集中趋势中,适用于品质数据的是

6、( )。A.众数B.简单算数平均数C.标准差D.加权算术平均数『正确答案』A【例题5·单选题】(2008年)下列数据特征的测度值中,受极端值影响的是( )。A.中位数B.众数C.加权算术平均数D.位置平均数『正确答案』C【例题6·多选题】几何平均数的主要用途是( )。A.确定分组组数B.确定组距C.对比率、指数等进行平均D.计算组中值E.计算平均发展速度『正确答案』CE【例题7·多选题】(2008年)下列统计指标中,可以采用算术平均数方法计算平均数的有( )。A.产品产量B.可支配收入C.产品合格率D.销售额E.考试分数『正确答案』ABD

7、E二、离散程度的测度离散程度是指数据之间的差异程度或频数分布的分散程度。集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。离散程度的测度,主要包括极差、方差和标准差、离散系数等。(一)极差极差是最简单的变异指标,是总体或分布中最大的标志值与最小的标志值之差,又称全距,用R表示。极差反映的是变量分布的变异范围或离散幅度,在总体中任何两个单位的标志值之差都不可能超过极差。极差仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受

8、极端值的影响。【例题1·单选题】(2010年)根据下表所列我国1998年至2003年人口数及构成情况,l998年至2003年我国男性人口占年底总人口比重的极差是( )。年份1998199920

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。