《统计数据整理》PPT课件

《统计数据整理》PPT课件

ID:36918925

大小:296.60 KB

页数:66页

时间:2019-05-10

《统计数据整理》PPT课件_第1页
《统计数据整理》PPT课件_第2页
《统计数据整理》PPT课件_第3页
《统计数据整理》PPT课件_第4页
《统计数据整理》PPT课件_第5页
资源描述:

《《统计数据整理》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章统计数据的整理第一节统计整理概述一、统计整理概念统计数据的整理(summarizingdata)是指对所搜集的数据进行加工整理、使之系统化、条理化,以符合分析的需要。包括对原始资料的整理和次级资料的整理统计资料的整理是实现从个体单位标志值过渡到总体数量特征值的必经阶段,是统计分析的前提。二、统计整理的程序(一)设计统计整理方案(二)对统计资料进行审核(三)统计资料的分组与汇总(四)编制统计图表(五)统计资料的积累和保管统计资料具体整理过程统计数据的具体整理过程主要包括包括数据的预处理、分类或分组、汇总等几个方面。一、数据的预处理主要包括:数据的审核、筛选、排队(

2、一)、数据的审核与筛选(一)、数据的审核与筛选审核:对第一手资料(直接调查或试验取得):审核其完整性与准确性完整性审核:应调查的单位或个体是否有遗漏;所调查的项目是否填齐全。准确性审核:内容是否符合实际;计算是否正确。对第二手资料(获取他人的资料):审核其完整性、准确性、适用性、时效性筛选:调查结束后,当对数据中发现的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,就需要对数据进行筛选。筛选包括:剔除不符合要求的数据或有明显错误的数据;将符合特定条件的数据筛选出来。(二)数据的排序数据排序是按一定顺序将数据排列。排序目的:通过浏览数据发现一些明显的特征趋

3、势或解决问题的线索;有助于数据的检查纠错。排序方式:数字型数据/字母型数据:升序或降序;汉字型数据:多种顺序,比如:拼音字母顺序或笔划顺序。第二节统计分组一统计分组的概念与种类1、统计分组的概念统计分组是将预处理过的数据按照某种标志(特征或标准)分成不同性质的组。统计分组标志:分组时所依据的特征或标准,有品质标志和数量标志。统计分组对总体而言是分,对于单位而言是合。由此可见,选择一种分组方法,突出一种差异,显示了一种矛盾,同时必然掩盖了其他差异。不同的分组方法,可能得出不同的结论。2、统计分组的原则穷尽性原则互斥性原则3、统计分组的种类(1)按分组标志的多少,分为简单

4、分组和复合分组。(2)按分组标志的性质不同,分为品质标志分组(或称属性分组)和数量标志分组(或称变量分组)(3)按分组的作用和任务的不同,分为类型分组、结构分组和分析分组。二统计分组的方法1、品质标志的分组方法关键是确定分组标志。一般比较简单,主要采用统一的分类标准。品质标志划分各组界限一般取决于统计分析对各组粗细的要求。但也要注意变异间的过度形态,是组限不易划分。例城乡划分。2、数量标志的分组方法关键是确定分组标志和确定分组界限。★分组数列的种类:分组数列离散型连续型单项式组距式等距数列异距数列等距数列异距数列2、数量标志的分组方法(1)单项式分组与组距式分组单项式

5、分组适用于离散型变量且变量变动范围不大的场合。比如育龄妇女按其生育子女存活数分组。组距式分组适合于连续型变量或者变动范围较大的离散型变量。(2)间断组距式分组和连续组距式分组如果变量值只是在整数间变动,可采用间断组距式分组,也可采用连续组距式分组。比如企业数、职工人数等。如果变量值在一定范围内的表现既可以是整数,也可以是小数,只能采用连续组距式分组。比如产值、身高、体重。注意:“上限不在内”原则的应用。(3)等距分组与异距分组等距分组适用:标志值变动比较均匀的情况。异距分组适用:标志值分布很不均匀的场合;标志值相等的量具有不同意义的场合;标志值按一定的比例发展变化的场

6、合。(4)组距、组数、组限与组中值的计算组距=上限-下限=本组上限-前组上限=本组下限-前组下限组数的确定:经验上以5~20之间为好,尤其注意不要确定太多的组数,使得每组包含的数据太少。组数的确定:实际分组时常按斯特格斯(Sturges)提出的经验公式来确定组数K:组中值计算:组中值=(上限+下限)/2一、频数分布的基本概念(一)频数:对分组后的数据,计算各组中数据出现的次数叫频数。(二)分布数列的两个要素一个是总体按某种标志所分的组,另一个是各组对应所出现的次数。预处理数据分组计算频数描述统计第三节频数分布◎频数分布或次数分布(Frequencydistributi

7、on):全部数据按其分组标志在各组内的分布状况。分布在各组内的数据个数称为频数或次数。Afrequencydistributionisatabularsummaryofasetofdatashowingthefrequency(ornumber)ofitemsineachofseveralnonoverlappingclasses.◎相对频数(Relativefrequency)/频率/比重:各组频数与全部频数之和的比值。Therelativefrequencyofaclassistheproportionofthetotalnumberofdata

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。