欢迎来到天天文库
浏览记录
ID:43809643
大小:129.50 KB
页数:29页
时间:2019-10-14
《统计学原理与技能训练 第3章 统计整理》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第三章 统计整理学习目标:1.掌握设计统计分组的基本原则和正确选择分组标志的原则;掌握按标志特征分组和按标志多少分组的方法;掌握组距变量数列的编制步骤。2.熟悉统计分组的概念和分组类型;熟悉组距数列设计的几个概念;熟悉有关频数分布的概念和分布数列的种类。3.了解数据整理的意义和内容,了解统计分组的作用。第一节 统计整理的意义和步骤一、统计整理意义(一)概念统计整理是根据统计研究的目的和要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化、科学化,从而得到表现总体特征的综合统计资料的统计过程。另外,对于整理过的初级资
2、料进行再整理,也属于统计整理。(二)意义1.统计整理是统计调查的继续,也是统计分析的前提,它在统计研究中起着承前启后的作用。2.资料整理得是否正确,直接决定着整个统计研究任务的完成。不恰当的加工整理,不完善的整理方法,往往使调查得来的丰富、完备的资料失去价值,得不到正确的结论。二、统计整理的步骤(一)设计和编制统计资料整理方案(二)对原始资料进行审查1.逻辑审查:主要是从定性的角度审查数据是否符合逻辑,内容是否合理,各项目或数量之间有无相互矛盾的现象。2.计算审查:是指审查调查表中的各项数据在计算结果和计算方法上有无错误。如各分项
3、数字之和是否等于相应的合计数,各结构之和是否等于1或100%等。(三)对各项原始资料进行分组并综合汇总(四)将汇总的结果以统计表或统计图的形式表现出来(五)将统计资料进行系统积累第二节统计分组一、统计分组的概念统计分组是根据研究任务的要求和现象总体内在的特点,将统计总体按照一定的标志划分为若干组成部分的一种统计分析方法。目的是揭示各组之间性质差异。二、统计分组的作用1.零星分散的统计资料,经过统计分组后,可以发现其特点及规律性。2.把复杂的现象总体区分为各个性质不同的组成部分,以认识现象之间质的差别。3.反映现象总体的内部结构及其
4、变化。4.分析现象之间的相互依存关系。三、选择分组标志的原则统计分组的关键问题是正确地选择分组标志与划分各组界限。选择分组标志的原则:1.要根据研究的目的与任务选择分组标志。2.要选择能够反映事物本质或主要特征的标志。3.要根据现象的历史条件及经济条件来选择。四、统计分组的方法1.根据分组标志的性质不同分为两种(1)按品质标志分组例如按性别这一品质标志可将班级的学生分为两组。(2)按数量标志分组如按成绩这一数量标志可以将班级学生分为三组:60分以下为一组,60~80分为一组,80分以上为一组。2.根据分组标志的多少分为两种(1)简
5、单分组按一个分组标志分组。(2)复合分组按两个或两个以上标志重叠分组。如按性别可以将人口分为两组,在此基础上又可以按年龄将各组的人分为少年组、青年组、中年组和老年组。第三节 分配数列一、分配数列的概念与种类1.概念将总体按某一标志进行分组,并按一定顺序排列出每组的总体单位数,所得到的数列称为分配数列,又称次数分布。2.关于分配数列的几个常识(1)分布在各组的总体单位数叫次数,又称频数。(2)各组次数和总次数之比称为比率,又称频率。分配数列根据分组标志的性质不同,可以分为品质数列与变量数列。(一)品质数列它是按品质标志分组形成的、用
6、来观察总体单位中不同属性的单位分布情况的数列。品质数列的编制比较简单,但要注意在分组时应包括分组标志的所有表现,不能有遗漏,各种表现要相互独立,不得相融。(二)变量数列它是按数量标志分组形成的、用来观察总体中不同变量值在各组的分布情况的数列。由于变量分为连续型变量和离散型变量,对这两类变量,在编制变量数列,其方法是不相同的:(1)离散型变量一般按单项式分组,即将每个变量值作为一组,编制单项式变量数列。(2)连续型变量一般只能按组距式分组,即以变量值的一定变动范围为一组,编制组距式变量数列。组距式变量数列的编制的步骤:第一步,计算全
7、距;第二步,确定组数和组距;第三步,确定组限和组中值;第四步,计算各组次数和组中值。在组距式变量数列中,需要明确以下各要素。1.组限组距式变量数列中,各组的界限的变量值称为组限。组限分为上限和下限。2.组距组距=上限-下限组距式变量数列有等距和异距之分。等距变量数列适用于现象的变动比较均匀的情况,如收入水平分组、单位面积农产品产量分组等。而现象变动不均匀或是为了特定的研究目的时,常采用异距分组。如人口的年龄分组常采用异距分组。3.组中值组中值是指每组下限与上限之间的中点数值。组中值=开口组的组中值计算公式:缺下限的最小组的组中值=
8、该组上限-缺上限的最大组的组中值=该组下限+组距式分组掩盖了各组标志值的分布情况,为了反映各组标志值的一般水平,通常用组中值作为各组的代表值。利用组中值的前提,是假定各组变量值的分布是均匀的或对称的,但在实际工作中大多数资料并非如此,因此,组中值作
此文档下载收益归作者所有