数据分布特征的描述讲义

数据分布特征的描述讲义

ID:38290188

大小:1.00 MB

页数:12页

时间:2019-06-07

数据分布特征的描述讲义_第1页
数据分布特征的描述讲义_第2页
数据分布特征的描述讲义_第3页
数据分布特征的描述讲义_第4页
数据分布特征的描述讲义_第5页
资源描述:

《数据分布特征的描述讲义》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第三章数据分布特征的描述(一)教学目的通过本章学习,掌握数据分布集中趋势和分布离散程度的测度,重点掌握分组数据的均值和标准差及变异系数的计算与众数、中位数和均值的比较,并能灵活加以运用,了解数据分布形状(即偏态与峰度)及其测度。(二)基本要求使学生熟练掌握数据分布特征的描述方法。(三)教学要点1、集中趋势的测度指标及其计算方法;2、离散趋势的测度指标及其计算方法;3、数据分布偏态与峰度的测度。(四)教学时数9课时(五)学习内容统计数据的分布特征可以从两个方面进行描述:一是数据分布的集中趋势,二是数据分布的离散程度。集中趋势和离散程度是数据

2、分布特征对立统一的两个方面。本章通过介绍平均指标和变异指标这两种统计指标的概念及计算来讨论反映数据集中趋势和分散程度的两个方面的特征。第一节数据分布集中趋势的测定集中趋势是指一组数据向某中心值靠拢的倾向,集中趋势的测度实际上就是对数据一般水平代表值或中心值的测度。不同类型的数据用不同的集中趋势测度值,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据,选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定。一般我们用平均指标作为集中趋势测度指标,本节重点介绍众数、中

3、位数两个位置平均数和算术平均数、调和平均数及几何平均数三个数值型平均数。一、众数(Mode)(一)概念众数是指一组数据中出现次数最多的变量值,用M0表示。从变量分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的变量值即为众数。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,也就有多个众数。1.集中趋势的测度值之一;2.出现次数最多的变量值;3.不受极端值的影响;4.可能没有众数或有几个众数;5.适用于定类数据、定序数据、定距数据和定比数据。众数的不唯一性:无众数原始数据:10

4、591268一个众数原始数据:659855多于一个众数原始数据:252828364242(二)众数确定1.定类数据和定序数据众数的测定定类数据与定序数据计算众数时,只需找出出现次数最多的组所对应的变量值即为众数。122.未分组数据或单变量值分组数据众数的确定未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值即为众数。3.组距分组数据众数的确定组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关系可作如下的理解:设众数组的频数为,众数前一组的频数为,众数后一组的频数为。当众数相邻两组的频数相等时,即=,众

5、数组的组中值即为众数;当众数组的前一组的频数多于众数组后一组的频数时,即>,则众数会向其前一组靠,众数小于其组中值;当众数组后一组的频数多于众数组前一组的频数时,即<,则众数会向其后一组靠,众数大于其组中值。基于这种思路,借助于几何图形而导出的分组数据众数的计算公式如下:其中:L表示众数所在组的下限;U表示众数所在组的上限;i表示众数所在组的组距;fm为众数组的频数;f-1为众数组前一组的频数;f+1为众数组后一组的频数。上述下限和上限公式是假定数据分布具有明显的集中趋势,且众数组的频数在该组内是均匀分布的,若这些假定不成立,则众数的代表

6、性就会很差。从众数的计算公式可以看出,众数是根据众数组及相邻组的频率分布信息来确定数据中心点位置的,因此,众数是一个位置代表值,它不受数据中极端值的影响。二、中位数(一)概念中位数是将总体各单位标志值按大小顺序排列后,处于中间位置的那个数值。1.集中趋势的测度值之一;2.排序后处于中间位置上的值;3.不受极端值的影响;4.适用于定序数据和数值型数据;5.各变量值与中位数的离差绝对值之和最小,即:(二)中位数的确定1.定序数据中位数的确定定序数据中位数确定的关键是确定中间位置,中间位置所对应的变量值即为中位数。(1)未分组原始资料中间位置的

7、确定(2)分组数据中间位置的确定122.数值型数据中位数的确定(1)未分组资料首先必须将标志值按大小排序。设排序的结果为:则:(2)单变量分组资料(3)组距分组资料①根据位置公式确定中位数所在的组;②假定在中位数组内的各单位是均匀分布的,就可利用下面的公式计算中位数的近似值:其中,是到中位数组前面一组为止的向上累计频数,则是到中位数组后面一组为止的向下累计频数;fm为中位数组的频数;i为中位数组的组距。三、算术平均数算术平均数(Arithmeticmean)也称为均值(Mean),是全部数据算术平均的结果。算术平均法是计算平均指标最基本、

8、最常用的方法。算术平均数在统计学中具有重要的地位,是集中趋势的最主要测度值,通常用表示。根据所掌握数据形式的不同,算术平均数有简单算术平均数和加权算术平均数。(一)简单算术平均数(Simple

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。