资源描述:
《统计学原理(第五版李洁明-祁新娥)2统计调查和统计整理》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
第一页,共七十七页。
1第二章统计调查与整理教学目的根据统计研究任务要求,采用科学的调查方式和方法搜集资料,是保证统计质量的基本环节。在学习中,要掌握统计调查方法和组织方式,以及各种方法的结合运用。通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。第二页,共七十七页。
2在学习过程中主要解决以下几个问题统计指标和指标体系的设计统计调查方案统计调查问卷的设计统计调查的组织方式第二章统计调查与整理第三页,共七十七页。
3一、统计调查的意义和要求统计调查是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集各项原始资料的过程。统计调查的意义统计调查阶段的工作的重要,由以下三个方面决定:(一)社会调查是人们认识社会的基本方式(二)统计调查是统计工作中的基础环节(三)统计调查理论和方法在统计学原理中占有重要地位第二章统计调查与整理第一节统计调查方案第四页,共七十七页。
4统计调查的基本要求准确性要求和及时性要求是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求。准确性及时性第五页,共七十七页。
5统计调查方案的内容1调查目的2调查对象和单位3调查项目5制定调查的组织6调查方法二统计调查方案的设计(六项基本内容)4调查时间和期限第六页,共七十七页。
6二统计调查方案的设计(六项基本内容)调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的。调查单位是进行研究的总体单位,也即登记的标志表现的直接承担者。(一)确定调查的目的——即为什么调查(二)确定调查对象和调查单位——即向谁做调查第七页,共七十七页。
7二统计调查方案的设计(六项基本内容)调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的。调查单位是进行研究的总体单位,也即登记的标志表现的直接承担者。(一)确定调查的目的——即为什么调查(二)确定调查对象和调查单位——即向谁做调查第八页,共七十七页。
8调查目的是调查所要达到的具体目标它回答的是:为什么要调查?要解决什么样的问题?调查具有什么样的社会经济意义?调查目的的写作应简明扼要例如:2000年第五次我国人口普查的目的是“为准确地查清我国在人口数量、地区分布、构成和素质方面的变化,为科学地制定国民经济和社会发展战略与规划,统一安排人民的物质和文化生活,检查人口政策执行情况,提供可靠的资料”。调查目的第九页,共七十七页。
9调查对象是根据调查目的确定的调查研究的总体或调查范围。调查单位是构成调查对象的每一个单位,是搜集数据资料的基本单位。调查对象和调查单位所解决的问题是:——向谁调查?——由谁来提供所需资料?例如:人口普查的调查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人。人口普查的调查单位是每一个人。注意:调查单位与填报单位的区别调查单位是调查项目的承担者;填报单位是负责上报调查资料的单位。调查对象和调查单位第二章统计调查与整理第十页,共七十七页。
10(三)确定调查项目——即调查什么拟订调查项目时要注意四个问题:调查项目要少而精;调查项目含义要明确,只列入能够得到确定答案的项目;-调查项目之间有一定的联系以便相互核对;-有的项目可以拟定为“选择式”。第十一页,共七十七页。
11调查表:列出调查项目的表格形式。调查表分为:一览表把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够;单一表将一个调查单位的项目登记在一份表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐。调查表也叫调查问卷(p23-30)第十二页,共七十七页。
12它可以是调查单位的数量特征,如一个人的年龄、收入,一个企业的职工人数、产值;调查项目是所要调查的具体内容也可以是调查单位的某种属性特征,如一个人的性别、职业,一个企业的经济类型等。调查项目和调查表第二章统计调查与整理在具体拟定调查项目时须注意下列四个问题:1.调查项目要少而精,只列入为实现调查目的所必需的项目;2.本着需要和可能的原则,只列入能够得到确定答案的项目;3.调查项目之间尽可能保持联系,以便相互核对起到校验作用;4.有的项目可拟定为“选择式”。第十三页,共七十七页。
13调查项目和调查表第二章统计调查与整理列出调查项目的表格形式就是调查表。一般分为一览表与单一表两种形式。一览表——是把许多调查单位和相应的项目按次序登记在一张表格里的一种统计表,当调查项目不多时可用一览表。单一表——是一张表格里只登记一个调查单位,如果项目多,一份表格可以由几张表组成。第十四页,共七十七页。
14调查表是用于登记调查数据的一种表格,一般由表头、表体和表外附加三部分组成。某企业基本情况报表(表头)制表机关:调查项目项目代码计量单位实际数值甲1人乙2台丙3人…………表体说明:……(表外附加)调查项目和调查表第二章统计调查与整理第十五页,共七十七页。
15调查表亦也可以是调查问卷。一份调查问卷设计质量的高低会直接影响到调查结果的好坏。故须注意以下几个问题:1.调查问卷的结构(由封面信〈一封给被调查者的短信〉、指导语〈用来指导被调查者填写问卷的说明〉、问题与答案〈是问卷的主体;问题分限定回答式和非限定回答式〉、编码〈即赋予每一个问题及其答案一个数字作为它的代码〉等组成)2.提问问题的格式(分为填空式、二项式或是否式、多项式、矩阵式、直线式、序列式)调查项目和调查表第二章统计调查与整理第十六页,共七十七页。
16调查表亦也可以是调查问卷。一份调查问卷设计质量的高低会直接影响到调查结果的好坏。故须注意以下几个问题:3.调查问卷设计的要求(1)要认识问卷设计的出发点;(2)问卷的问题必须围绕假设进行设计;(3)问题的表述要清楚(每个问题要规范化、标准化;一句话只问一件事,不要问两件或两件以上的事;提问不能带有暗示;问题间的承接要清楚)(4)所列问题不能超出回答者的能力;(5)问卷中的问题应尽量避免社会禁忌和敏感性问题;(6)问题的排列顺序要恰当;(7)方案应尽可能简明扼要;(8)限定式问题中的答案要具有穷尽性和互斥性。调查项目和调查表第二章统计调查与整理第十七页,共七十七页。
17(四)确定调查时间和调查期限——即在什么时间调查要区别调查时间和调查期限的不同:-调查时间是指调查资料所属的时间(时点或时期);-调查期限是指调查工作的起讫时间。(五)制定调查的组织实施计划第十八页,共七十七页。
18为确保调查资料的准确性,统计调查必须规定这两种时间是调查资料所属的时间。即规定所调查的是哪个时期或时点的资料。是进行调查工作的期限。即从调查工作开始到结束的时间长度。例如:第四次人口普查规定的标准时间是“1990年7月1日0时”,并要求在“1990年7月1日至10日完成普查的登记工作”。1990年7月1日0时就是调查时间,1990年7月1日至10日就是调查时限。调查时间:调查时限:调查时间和时限调查的组织工作这项内容包括的比较多,如调查机构的确定,调查人员的选择、培训,调查经费的来源和支出预算,以及其它一些调查工作的准备等。第二章统计调查与整理第十九页,共七十七页。
19(六)选择统计调查的方法(p31)直接观察法报告法询问法通讯法网上调查法采访法第二十页,共七十七页。
20第二节统计调查的组织(即调查的种类)按调查的范围分,统计调查可以分为:全面调查和非全面调查;(p32-37)按登记事物的连续性分,统计调查可以分为:经常调查和一时调查;(p38-39:表2-2)按组织形式分,统计调查可以分为:统计报表制度和专门调查。(p38)第二十一页,共七十七页。
21分为:普查抽样调查统计报表重点调查典型调查普查涵义:普查是专门组织的,一般用来调查属于一定时点上社会经济现象数量的全面调查。普查是专门调查特点普查是全面调查普查是一种不连续调查普查通常是一次性的或周期性的普查必须规定标准调查时间作用:普查主要用来搜集那些反映国情国力方面的基本统计资料。例如:人口普查、工业普查、物资库存普查、乡镇企业普查、商业饮食业普查等等。第二章统计调查与整理第二节统计调查的组织形式指组织统计调查,搜集信息资料的方式第二十二页,共七十七页。
22抽样调查(p35,第六章)抽样调查是一种非全面调查,它是按照随机原则从总体中抽取部分单位进行观察,用以推断总体数量特征的一种调查方式。是一种非全面调查,但是又要达到对总体数量特征的认识。按照随机原则抽选调查单位。经济性、时效性、准确性、灵活性能够解决全面调查无法或难以解决的问题。可以补充和订正全面调查的结果。可以用于对总体的某种假设进行检验。简单随机抽样类型随机抽样等距随机抽样整群随机抽样组织形式对总体不进行任何整理,直接从总体中按照随机原则抽选调查单位。作用特点涵义优点先对总体各单位按主要标志进行分类,再按随机原则抽选调查单位。将总体各单位按某一标志大小顺序排列,然后依一定间隔抽取样本单位进行调查。先将总体各单位划分为许多群,再以群为单位,从中随机抽选部分群,对中选群的所有单位进行调查。第二章统计调查与整理第二十三页,共七十七页。
23统计报表(p34-35)什么是统计报表?基本特点是什么?有何作用?有哪几种类型?重点调查与典型调查(p36-38)都属于非全面调查二者共同点根据客观标准选择重点单位在对现象分析的基础上有意识地选择典型单位调查目的不同选择调查单位的方法不同重点调查典型调查重点调查的目的是反映总体的基本情况典型调查的目的是推算总体的数量特征二者区别第二章统计调查与整理第二十四页,共七十七页。
24统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。一、统计整理的意义和内容(p39-41)第三节统计分组第二十五页,共七十七页。
25第三节统计分组1.概念把同质总体中的具有不同特点的单位分开,从而正确地认识事物的本质及其规律性。一统计分组的概念和作用2.作用主要有三个方面:第二十六页,共七十七页。
26揭露社会经济现象的类型,反映各类型的特点。例如(表2-4)⑴类型分组第二十七页,共七十七页。
27说明社会经济现象的内部结构。例如(表2-5)⑵结构分组第二十八页,共七十七页。
28研究经济现象之间的依存关系。例如(表2-6)⑶分析分组第二十九页,共七十七页。
29三:分组标志的选择(p45-46)选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标志的选择是统计分组的关键。第三十页,共七十七页。
30选择分组标志的原则根据研究问题的目的来选择要选择最能反映被研究现象本质特征的标志要结合现象所处的具体历史条件或经济条件来选择第三十一页,共七十七页。
31品质标志分组——反映事物属性差异分组标志的种类1.按分组标志的特征不同分为:-简单分组。如人口按性别分组。-复杂分组,亦称分类。如人口按职业分组。-单项式数量分组——运用于变量变动幅度小、项目少的分组。如:看管机器台数分组(0,1,2,3,4,…)-组距式分组——运用于变量变动幅度大、项目多的分组。如:按月工资(元)分组(600~650,650~700,700~750,…)数量标志分组——反映事物数量差异第三十二页,共七十七页。
32分组标志的种类2.按总体所选择标志的个数分:无论是简单分组还是复合分组,都只能对社会经济现象从一个方面或几个方面进行观察和分析研究,而对社会经济现象需要从各方面进行观察和分析研究,这就需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。简单分组——按一个标志对总体进行分组复合分组——按两个或两个以上标志对同一总体进行分组第三十三页,共七十七页。
33四:简单分组、复合分组和分组体系(p46-47)选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标志的选择是统计分组的关键。第三十四页,共七十七页。
34第四节分配数列一分配数列的概念和种类(p48-49)统计总体按照某一标志分组以后,用以反映总体各单位分配情况的统计数列,称分配数列,又可称次数分配,或次数分布。1.概念第三十五页,共七十七页。
35例月工资分组(元)工人数(人)占总数比重(%)1000以下21039.61000-150018735.31500以上13325.1合计530100.0组别(变量)次数(频数)频率(比率)频率:各组的频率大于0,各组的频率总和等于1或100%。第三十六页,共七十七页。
362.种类一、分配数列的概念和种类品质分配数列变量分配数列单项式分配数列组距分配数列等距数列异距数列分配数列(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征。)第三十七页,共七十七页。
372.种类一、分配数列的概念和种类以分组标志特征不同分为:品质数列变量数列第三十八页,共七十七页。
38例某班学生的性别构成情况按性别分组绝对数人数比重(%)男3075女1025合计40100组别次数频率⑴品质数列(表2-7)第三十九页,共七十七页。
39⑵变量数列(p48)单项变量数列(单项数列)——按每个变量值分别列组编制数列,适用于不连续变量或变量能以整数表示,其变动范围不大时。组距变量数列(组距数列)——按组距分组编制数列。适用于连续变量或变量可用小数表示,其变动范围较大时。第四十页,共七十七页。
40单项数列见例如下:(表2-8)某厂第二季度工人平均日产量工人平均日产量(件)工人人数(人)210315430540620合计115第四十一页,共七十七页。
41从另一角度看,变量数列分为:连续变量数列——可有小数,采取组距式。非连续变量数列——整数,采取单项式或组距式(例:一个地区的企业按职工人数分组)。第四十二页,共七十七页。
42二组距数列的编制组限组距两端的数值。分为上限和下限。组距某一组的上限和下限的距离,分等距和异距。全距分组数列中最大值的上限与最小值的下限之差。组中值组的上限和下限的中间值。因数列两端组限形式不同分:开口式组距:最低组与最高组不封口。例:成绩60分以下,90分以上。闭口式组距:例40-60分,90-100分。组距=上限-下限第四十三页,共七十七页。
43(一)确定组距和组数(p50-51)组距某一组的上限和下限的距离,分等距和异距。组距=上限-下限全距分组数列中最大值的上限与最小值的下限之差。第四十四页,共七十七页。
44例若将考试成绩仅分为不及格与及格两组,则可编成如下组距数列:某班学生统计学考试成绩表考试成绩(分)人数(人)56-60260-10038合计40第四十五页,共七十七页。
45若把上表改变为如下统计表,则基本上能准确反映总体的分布特征。某班学生统计学考试成绩表(表2-10)考试成绩(分)人数(人)比重(%)50-6025.060-70717.570-801127.580-901230.090-100820.0合计40100.0第四十六页,共七十七页。
461.等距数列(p51-52)各组组距均相等。如:10—2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。2.异距数列(p53-54)各组组距不一定相等。如:10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。(二)等距分组和异距分组第四十七页,共七十七页。
471.组限(p55)组限就是每一组两端的数值。10—2020—3030—40下限上限确定组限的方法有两种:按连续变量分组和按离散变量分组。职工人数(人)99以下100—199200—299300—399固定资产额(万元)50—6060—7070—8080—90间断式确定组限适用于离散变量重叠式确定组限适用于连续变量上组限不在内(三)组限和组中值(p54-56)第四十八页,共七十七页。
482.组中值(p55)每组上限与下限之间的中点数值,是各组的假定平均数。组中值=(上限值+下限值)÷2开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=75第四十九页,共七十七页。
49合理确定组中值例如:第一组:50人以下第二组:50—200人按公式应定下限为0注意:当连续型变量按离散变量表示,组距数列的编制采取相邻组限不重叠形式,组中值的确定应考虑到连续型变量自身的特点。第五十页,共七十七页。
50例:分配数列的编制1、品质分配数列的编制:只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:100250合计4032208100805020国有企业股份制企业合资企业独资企业比重(%)企业数经济类型第五十一页,共七十七页。
512、变量分配数列的编制:其基本步骤为:第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型和分组方法(单项式分组或组距分组)。第三步:确定组数和组距。当组数确定后,组距可计算得到:组距=全距÷组数全距=最大变量值-最小变量值第五十二页,共七十七页。
52第四步:确定组限。注意:第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。)第五步:汇总出各组的单位数,计算频率,并编制统计表。注意不同方法确定的组限在汇总单位数时的区别第五十三页,共七十七页。
53间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。职工人数(人)499以下500—599600—699700—799重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。产值(万元)50—6060—7070—8080—90单位数(个)单位数(个)因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。第五十四页,共七十七页。
54三累计次数分布1.次数分布的表示方法⑴表示法——即用统计表来表示次数分布。第五十五页,共七十七页。
55例考分次数向上累计(上限)向下累计(下限)人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合计40100.0----某班统计学考试成绩次数分配第五十六页,共七十七页。
56向上累计:以下累计次数(上限)——即较小制累计。每一组的累计次数表示小于该组上限(变量)值的次数共有多少。向下累计:以上累计次数(下限)——即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。第五十七页,共七十七页。
57⑵图示法即用统计图来表示次数分布直方图折线图曲线图第五十八页,共七十七页。
58直方图(或次数分配曲线图)仍以上例考试成绩数据,画成如下直方图:405060708090100110第五十九页,共七十七页。
59若组距不等的话,用标准组距人数,然后据此画直方图:按工人年龄分组(岁)组距人数(人)标准组距人数(人)频数密度=频数/组距15-20517173.420-25528285.625-30540408.030-355707014.035-45106532.56.545-50510102.0合计-230--第六十页,共七十七页。
60直方图例10152025303540455055第六十一页,共七十七页。
61折线图在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配曲线图:405060708090100110第六十二页,共七十七页。
62折线图还可用来表示累计次数分布(仍以上例数据):曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。向下累计向上累计第六十三页,共七十七页。
63钟型分布、U型分布、J型分布钟型分布:特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。U型分布:特征是靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,其形状宛如英文字母U。J型分布:特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大写字母J。四.次数分布的主要类型第六十四页,共七十七页。
64钟型分布1.对称型第六十五页,共七十七页。
65YY右偏型(上偏型)左偏型(下偏型)XX2.偏态分布钟型分布第六十六页,共七十七页。
66反J型分布U型分布正J型分布第六十七页,共七十七页。
67第五节统计表一统计表的作用四点作用(p59-60)第六十八页,共七十七页。
68从构成要素看:统计表由总标题、分标题(横行标题、纵栏标题)、数字资料构成。从内容上看:统计表由主词和宾词两部分构成。主词说明总体或总体的分组。宾词说明总体的统计指标。第五节统计表二、统计表的结构第六十九页,共七十七页。
69例分组总产值(万元)职工人数(人)劳动生产率(元/人)P123大型中型小型合计2003年某月某公司各企业劳动生产率统计表单位____横行标题主词宾词总标题纵栏标题数据资料(指标数值)第七十页,共七十七页。
70三统计表的种类简单表总体未分组分组表总体按一个标志进行分组复合表总体按二个或二个以上标志进行复合分组第七十一页,共七十七页。
71简单表表2-15某年某公司所属两企业自行车合格品数量表厂别合格品数量(辆)甲厂5000乙厂7000合计12000例第七十二页,共七十七页。
72复合表表2-16某年某地区工业增加值和职工人数项目增加值(万元)职工人数(人)内资企业大型975013800中型860045000小型420010050外商投资经营企业大型73007500中型520010400小型44004500例第七十三页,共七十七页。
73四、宾词指标的设计(p62-63)两种设计方式:1.简单设计(表2-17)2.复合设计(表2-18)第七十四页,共七十七页。
74五、编制统计表应注意的问题1.总标题简明地概括内容;2.先整体后局部,先列项目后列总体;3.必须注明计量单位;4.数字要上下对齐;5.表的左右两端是开口式,不画纵线,表的上下通常用粗线封口,;6.统计表应加注解,资料来源等写在表的下端。第七十五页,共七十七页。
75EndofChapter2第七十六页,共七十七页。
76内容总结第二章统计调查与整理。(一)社会调查是人们认识社会的基本方式。调查项目含义要明确,只列入能够得到确定答案的项目。如一个人的年龄、收入,一个。一览表——是把许多调查单位和相。问题分限定回答式和非限定回答。式〉、编码〈即赋予每一个问题及其答案一个数字作为。(5)问卷中的问题应尽量避免社会禁忌和敏感性问题。7月1日0时”,并要求在“1990年7月1日至10日。乡镇企业普查、商业饮食业普查等等。说明总体或总体的分组第七十七页,共七十七页。