数据分布特征描述

数据分布特征描述

ID:39447999

大小:815.00 KB

页数:92页

时间:2019-07-03

数据分布特征描述_第1页
数据分布特征描述_第2页
数据分布特征描述_第3页
数据分布特征描述_第4页
数据分布特征描述_第5页
资源描述:

《数据分布特征描述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、统计应用一种测量的平均数比单个的测量更可靠即使用一种很准确、很可靠的仪器对同一物体进行重复测量,由于一些无法控制的因素的影响,每次得到的结果也不见得一样(美国)国家标准与技术协会(NIST—NationalInstituteofStandardsandTechnology)的原子钟非常准确,它的准确程度是每600万年误差1秒,但也并不是百分之百准确世界标准时间是世界协调时间(UniversalCoordinatedTime),它是由位于法国的塞夫尔的国际计量局(BIPM)所“编辑”的。BIPM并没有比NIST更好的钟,它给出的时间是根据世界各

2、地200个原子钟的平均时间得来的统计应用一种测量的平均数比单个的测量更可靠下面是NIST的时间与正确时间的10个误差数据(秒)长期来讲,对时间的度量并没有偏差。NIST的秒有时比BIPM的短,有时比BIPM的长,并不是都较短或较长。尽管NIST的测量很准确,但从上面的数字还是可以看出有些差异。世界上没有百分之百可靠的度量,但用多次测量的平均数比只用一次测量的结果可靠程度会更高。这就是BIPM要结合很多原子钟的时间的原因0.0000000070.0000000000.0000000020.000000005-0.000000003-0.0000

3、000010.000000006-0.000000005-0.0000000010.000000000第三章数据分布特征描述第一节统计变量集中趋势的测定第二节统计变量离散程度的测定第三节变量分布偏度和峰度的描述学习目标1.集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合3.离散程度各测度值的计算方法4.离散程度各测度值的特点及应用场合偏态与峰态的测度方法用Excel计算描述统计量并进行分析数据的特征和度量对于描述统计中的测度,主要可以分为三个方面来描述:一是数据的集中趋势,反映各数据向其中心值靠拢或聚焦的程度;二是分布的离散程度

4、,反映各数据远离其中心值的趋势;三是数据分布的形状,即数据分布的偏态和峰度。数据分布的特征集中趋势(位置)偏态和峰态(形状)离中趋势(分散程度)数据的特征和度量数据的特征和度量集中趋势算术平均数调和平均数几何平均数中位数众数百分位数四分位数集中趋势极差四分位距平均差方差与标准差标准分数离散系数分布形状偏态测度峰态测度第一节统计变量集中趋势的测定一、测定集中趋势的意义集中趋势(Generaltendency)是指分布的定位,它是指一组数据向某一中心值靠拢的倾向,或是表明一组统计数据所具有的一般水平。对集中趋势进行测度也就是寻找数据一般水平的代表

5、值或中心值。对集中趋势的度量有数值平均数和位置代表值之分。集中趋势的度量类别数值平均数就是对所有各项数据计算的平均数。因此它能够概括反映所有各项数据的平均水平。常用的数值平均数有算术平均数、调和平均数和几何平均数。平均的对象可理解为变量,平均数可记为位置代表值是在总体中将变量值按顺序排列后得到的数列中某个特殊位置的值。常用的位置代表值有众数、中位数和其他分位数等。二、位置代表值——众数Mo(一)众数Mo1.定义:众数是指总体中出现次数最多的那个数据值。频数或频率最大的标志值。2.众数的确定1)未分组和单项式变量数列确定众数:出现次数最多的标志

6、值就是众数。2)组距式变量数列确定众数:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值。如,某百货商店在女式旅游鞋销售中,23码的鞋销售量最多,则众数为23码。【例3-1】根据某班学生年龄分组资料(表4-1),求年龄众数。表3-1某班学生年龄分组表年龄(岁)171819202122学生人数(人)1281531经观察发现,20岁的学生人数最多,因此众数为20岁。1)未分组和单项式变量数列确定众数2)组距式变量数列确定众数——几何意义2)组距式变量数列确定众数——公式下限公式:上限公式:表3—1某地区年人均纯收入资料年人均纯收

7、入(元)农户数(户)400-500400500-600600600-7001070700-800510800-900260900-1000160合计3000经观察,可知变量值600—700元这一组出现的频数最多,为1070户,即众数组为变量数列的第三组。则利用上限公式得(用下限公式也可):由计算结果可知,众数为645.63元。2)组距式变量数列确定众数(一)众数3.众数的特点(1)众数不受极端值的影响。适用于各种类型的数据。(主要用于分类数据,也可用于顺序数据和数值型数据)(2)当变量数列为均匀分布、U型分布、J型分布时,不存在众数;(3)众

8、数缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息。众数(不惟一性)无众数原始数据:10591268一个众数原始数据:6

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。