变量的描述统计离散趋势分析和集中趋势分析

变量的描述统计离散趋势分析和集中趋势分析

ID:39388739

大小:744.50 KB

页数:67页

时间:2019-07-02

变量的描述统计离散趋势分析和集中趋势分析_第1页
变量的描述统计离散趋势分析和集中趋势分析_第2页
变量的描述统计离散趋势分析和集中趋势分析_第3页
变量的描述统计离散趋势分析和集中趋势分析_第4页
变量的描述统计离散趋势分析和集中趋势分析_第5页
资源描述:

《变量的描述统计离散趋势分析和集中趋势分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第五讲:单变量描述统计集中趋势测量&离散趋势测量1知识点: 两个维度——七个统计量数2学习要求1、集中趋势各测量法的计算方法;2、集中趋势各测量法的特点和应用;3、离散程度各测量法的计算方法;4、离散程度各测量法的特点与应用;3单变量描述统计在统计分析中,是否可以找出一个有代表性的数值来说明变量的分布,反映资料的集中或差异情况?集中趋势测量,就是以一个数值来代表变量的资料分布,反映的是变量值向中心值聚集的程度,也就是说以这一个数值(或称典型值)来估计或预测每一个研究对象的数值时发生的错误总数在理论

2、上是最小的。离散趋势测量(Measuresofdispersion)就是用一个值表示数据之间的差异情况。离散趋势测量法和集中趋势测量法具有互补作用。在进行统计分析时,既要测量变量的集中趋势,也要测量离散趋势。4集中趋势测量/分析集中趋势测量:用某一个典型的变量值或特征值来代表全体变量的问题,这个典型的变量值或特征值就称作集中值或集中趋势。★众值(Mode)——定类层次★中位值(Median)——定序层次★均值(Mean)——定距层次5一、众数(mode)1、出现频次最多的变量值;2、众数的不唯一性

3、;3、主要应用于定类变量,当然也可以应用于定序和定距变量6众数的特点:不唯一性原始数据:4、5、7、8、19(无众值)原始数据:4、5、7、5、5、16(一个众值)原始数据:4、4、5、7、7、9(两个众值)7例1:非连续取值8例2分组数据收入(元)fCf↑Cf↓500-6991010550700-8996575540900-10991262114751100-12991583693391300-14991415101811500-16994055040总数5509从分布来看,众数是具有明显集中趋

4、势点的数值,一组数据分布的最高峰点所对应的数值及为众数。10二、中位值(Median)1、把一组数据按顺序排列,处于中间位置的那个数值就是中位值。2、主要应用于定序变量,也可用于定距变量,但不可用于定类变量。50%50%Md11(1)未分组数据求中位数:Md位置=(2)中位数=中间位置的值注意:先找位置,再找中位数将各个个案由低至高排列起来,居序列中央位置的个案值就是中位值。12(1)、个案数为奇数【例1】:甲地的5户人家的人数为:2,4,3,6,8,求中位值。解:Md的位置===3排序2,3,4

5、,6,8中位值Md=413(2)个案数为偶数【例2】:乙地的6户人家的人数为:2,4,3,6,8,5求中位值。解:Md的位置===3.5排序2,3,4,5,6,8Md==4.514(3)频数分布表【例3】根据下表求中位值。解:Md位置===250.5中位值Md=乙152、分组数据根据统计表中的累积百分比,找出含有50%的区间找出含有50%区间的上界值U,下界值L,上界累计百分数U%,下界累计百分数L%以及组距等信息根据线段对应成比例的原理,计算出累计百分比为50%的变量值16L:中位数组的下限f:

6、中位数组的频数w:中位数组的组距(U-L)cf:低于中位数组下限的累加次数n:全部个案数Md位置=n/2(上下各50%的位置)17例:分组数据:首先将各组的次数累加起来求中位数的位置:Md位置=n/2=212/2=106第106个位置在25-35之间18分组变量看作是一组连续的数值259435124?10610301219【例4】:根据下表数据求中位值。解:Md位置=50;从累积频数cf栏找到中位数位置所在组为“300-400”引入公式:=35020三、均值1、均值的定义:总体各单位取值之和除以总

7、体单位数目。2、仅适用于定距变量,不适用于定类和定序;211、未分组数据(1)简单原始资料求均值22均值的计算——未分组数据【例5】某班10名学生年龄分别为20、21、19、19、20、20、21、22、18、20岁,求他们的平均年龄。解:根据平均数的计算公式有:23(2)、加权平均数某个变项值重复出现多次,可以先统计每个值(x)的次数(f),再求次数与相应变量值的乘积(fx),利用各乘积之和求出均值。(f也称为权数,f/n称为权重)公式:24未分组数据加权平均数【例6】调查某年120名学生的年龄

8、,结果如下表,求平均年龄。解:根据公式得=18.9岁252、分组资料求均值:根据组中值求均值先求出组中值组中值=(上限+下限)/2计算组中值的和计算分组数据的均值组中值26众值、中位数和均值的比较1注:▲表示该数据类型最适合用的测度值27众数、中位数和平均值的比较众数是一组数据中出现次数最多的数值。但在社会调查中众数的代表性较小28中位数和平均数的比较计算平均数时用到数据中所有的数值,而求中位数时只用到数值的相对位置,平均数比中位数利用了更多的有关数据的信息平均数容易受到极端值的影

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。