大学统计学课件2调查与整理

大学统计学课件2调查与整理

ID:82012380

大小:2.28 MB

页数:72页

时间:2023-10-26

上传者:183****4338
大学统计学课件2调查与整理_第1页
大学统计学课件2调查与整理_第2页
大学统计学课件2调查与整理_第3页
大学统计学课件2调查与整理_第4页
大学统计学课件2调查与整理_第5页
大学统计学课件2调查与整理_第6页
大学统计学课件2调查与整理_第7页
大学统计学课件2调查与整理_第8页
大学统计学课件2调查与整理_第9页
大学统计学课件2调查与整理_第10页
资源描述:

《大学统计学课件2调查与整理》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1第2章统计数据的收集、整理与显示

12§2.1.1统计调查的意义有组织、有计划地收集大量统计数据的过程。是统计工作的基础环节。与一般社会调查的主要区别(1)主要着眼于数字资料的收集;(2)不是收集个别单位的资料,而是收集大量单位的资料并能够据以汇总计算形成说明总体的综合数据。§2.1统计数据的收集——统计调查

23对统计调查的要求准确、及时、完整。准确(真实、客观)——如实反映客观实际。真实性是统计的生命。完整——调查方案规定调查的单位要全、项目要全,不能遗漏。资料残缺不全,就不能正确、系统地反映现象总体的实质和规律性。及时性——在规定时间内尽快提供统计资料。过时的信息有如“雨后送伞”。

34§2.1.2统计调查方案调查方案的内容调查目的调查对象调查单位调查项目和调查表其他

45调查要达到的具体目标回答“为什么调查?”调查之前必须明确1.确定调查目的

56调查对象:调查研究的总体或调查范围调查单位:需要对之进行调查的单位。可以是调查对象的全部(全面调查),也可以是调查对象中的一部分单位(非全面调查)回答“向谁调查?”调查对象调查单位?2.确定调查对象和调查单位调查单位与报告单位存在不一致性

67调查项目:调查的具体内容调查表:表现调查项目的表格或问卷调查表——单一表和一览表回答“调查什么?”Q1…………Q2…………Q3…………Q4…………3.确定调查项目和调查表

784.确定调查方式方法5.确定调查时间调查的标准时间——资料所属时间调查工作的起止时间(六)确定其它事项调查组织机构人员培训试点经费.....

89§2.1.3统计调查的组织形式

910全面调查特点:资料齐全、能够满足各级政府领导管理需要;不存在代表性误差。耗费大,易产生登记性误差。收集重要的、基础性数据。非全面调查特点:耗费小(人财物时间),不易产生登记性误差,存在代表性误差。应用广泛。

10111..普查为特定目的专门组织的一次性全面调查调查内容详细、提供重要国情国力资料、数据的规范化程度较高提供抽样框特别注意必须规定标准时间在规定时间内统一进行基本内容和指标解释统一并相对稳定总体

11122.统计报表概念按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据。特点全面性、稳定性、连续性、可比性曾经是我国数据收集的主要方式耗费大、数据质量差等等。

1213第二次全国经济普查的标准时点是2008年12月31日,时期资料为2008年度。第六次全国人口普查主要目的:人口普查是一项重大的国情国力调查。组织开展第六次全国人口普查,将查清十年来我国人口在数量、结构、分布和居住环境等方面的变化情况,为科学制定国民经济和社会发展规划,统筹安排人民的物质和文化生活,实现可持续发展战略,构建社会主义和谐社会,提供科学准确的统计信息支持。内容:人口和住户的基本情况,内容包括:性别、年龄、民族、受教育程度、行业、职业、迁移流动、社会保障、婚姻生育、死亡、住房情况等。时间:标准时点是2010年11月1日零时。

13张高丽在第三次全国经济普查电视电话会议上强调依法科学创新开展经济普查推动经济持续健康发展第三次全国经济普查电视电话会议(2013年)8月29日在京召开,中共中央政治局常委、国务院副总理、国务院第三次全国经济普查领导小组组长张高丽出席会议并讲话。他强调,第三次全国经济普查是在我国步入全面建成小康社会决定性阶段进行的一次重大国情国力调查,要提高认识、统筹安排、精心组织,坚持依法、科学、求是、创新普查,摸清底数、搞准情况,做到心中有数,为有效应对风险和挑战、推动经济持续健康发展提供基础信息依据。

14定期开展经济普查,是认识国情、摸清家底的重大举措,是提高决策和管理科学化水平的重要基础性工作。在新的形势下,开展第三次全国经济普查,有利于准确判断经济形势的新变化、掌握经济发展的新情况、把握发展阶段的新特征,对于贯彻落实党的十八大精神,坚持稳中求进的工作总基调,以提高经济发展质量和效益为中心,稳增长、调结构、促改革、惠民生,促进中国经济转型升级,具有十分重要的意义。

15163.重点调查从调查对象的全部单位中选择一部分重点单位进行调查重点单位——标志值在总体标志总量中占有较大比重的单位调查结果一般不宜用于推断总体了解总体的基本情况重点调查的适用场合客观存在重点单位

16174.抽样调查从总体中随机抽取一部分单位(样本)进行调查经济性、时效性、准确性目的是推断总体的未知数字特征应用最广泛的调查方式可以计算和控制误差

1718中华人民共和国主席令第十五号《中华人民共和国统计法》已由中华人民共和国第十一届全国人民代表大会常务委员会第九次会议于2009年6月27日修订通过,现将修订后的《中华人民共和国统计法》公布,自2010年1月1日起施行。中华人民共和国主席胡锦涛2009年6月27日收集、整理统计资料,应当以周期性普查为基础,以经常性抽样调查为主体,综合运用全面调查、重点调查等方法,并充分利用行政记录等资料。国家统计数据以国家统计局公布的数据为准。

1819§2.1.4统计数据收集的具体方法数据的收集方法访问法报告法访问调查直接观察法电话调查邮寄调查观察法电脑辅助座谈会个别深访实验法

1920§2.2统计数据的整理§2.2.1统计数据整理的意义将统计调查阶段所收集到的大量个体资料进行科学的分类汇总、加工处理,或对已经经过加工的次级资料再加工,使之系统化、条理化、能够反映事物总体特征的综合资料的过程。个体资料→综合资料统计调查到统计分析的中间环节

2021§2.2.2统计整理的基本方法—统计分组1.统计分组的概念和含义按一定的标志把总体分成若干组对总体——分,对个体——合,突出组与组之间的差异、抽象组内各单位差异2.分组的原则科学性完备性互斥性

2122关键:服从研究任务需要,反映总体本质特征形式按分组标志性质分品质标志分组数量标志分组按分组标志个数分简单分组复合分组3.统计分组的种类

222325%33%42%划分现象类型——最基本的作用

23研究总体结构例:我国三次产业结构(%)研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(2009年)按收入分组(元)低收入户中低收入户中等收入户中高收入户高收入户恩格尔系数(%)47.0045.8843.7040.5434.762012年国内生产总值519322亿元。第一产业增加值占国内生产总值的比重为10.1%;第二产业增加值比重为45.3%;第三产业增加值比重为44.6%。

2425§2.2.2分布数列—统计分组整理的基本结果1.分布数列的意义和构成意义构成要素各组名称或变量值次数(频数或频率)

252.分布数列的种类1.品质数列按品质标志分组形成的分布数列构成要素各组名称各组次数频数(绝对次数)频率(相对次数,即比重)产业就业人数(万人)比重(%)第一产业2970838.1第二产业2168427.8第三产业2660334.1合计7799510026表2-1我国三产业就业情况(2009)定类

2627变量数列等距数列异距数列单项式变量数列组距式变量数列2.变量数列

2728表2-2某企业工人日产量日产量工人数107011100123801315014100合计800单项式数列一个变量值为一个组适合于离散型变量且变动范围小

2829组距式变量数列适合于连续变量适合于变量值变动幅度大的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组~~~~~将变量值的一个区间作为一组

2930表2—3某班学生考试成绩次数表成绩(分)学生人数比重(%)60以下23.5760-701526.7970-802035.7180-901526.7990-10047.17合计56100.00

3031(上下组限重叠)表2-4某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计50100

3132(上下组限间断)表2-5某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计50100

3233

3334组距数列中的主要概念组限——组与组之间的界线上限——一组的最大值下限——一组的最小值开口组组距=上限-下限组距可以相等——称为等距数列,也可以不相等——称为异距数列假定:开口组的组距=邻组组距组中值=(上限+下限)/2代表组内的一般水平假定组内标志值均匀分布或对称分布

3435等距分组与不等距分组等距分组各组次数的多少不受组距大小的影响可直接根据次数(频数或频率)来观察变量的分布特征和规律不等距分组各组次数的多少要受组距大小不同的影响各组次数不能直接反映频数分布的实际状况用频数密度才能比较各组次数分布的实际状况频数密度=频数/组距异距分组的应用

3536使用开口组的若干理由——保证分组的完备性;避免有些区间的次数为0;保密需要

3637确定全距3.变量数列的编制确定组数确定组限计算频数排序编制表格

3738确定组数根据分组研究的需要来确定达到显示数据的分布特征和规律的目的确定组距确定全距:全距=最大值-最小值确定组距:组距=全距/组数确定各组的组限组限要表现事物变化的度、规定的界限体现分布的集中趋势充分考虑到习惯、便于对比根据分组整理成频数分布表

38394.累计次数向上累计向下累计

39成绩 (分)学生人数 (人)频率 (%)向上累计向下累计频数频率(%)频数频率(%)60以下60—7070—8080—9090-100215201543.5726.7935.7126.797.142173752563.5730.3666.0792.86100.00565439194100.0096.4369.6433.937.14合计56100.00————————表2-7某班学生考试成绩累计次数表向上累计:小于该组上限的次数(百分数)向下累计:大于该组下限的次数(百分数)

4041

41425.次数分布的类型和次数分布图钟型分布——中间多、两头少对称分布——如正态分布左偏分布(负偏)右偏分布(正偏)U型分布J型分布(1)次数分布的主要类型

42U型分布正J型分布反J型分布对称分布右偏分布左偏分布

4344(2)次数分布图—定量数据整理结果的另一表现形式次数分布图显示次数分布特征的统计图形常用的次数分布图有三种:直方图折线图曲线图

4445直方图——用矩形的宽度和高度来表示频数分布的图形直方图的绘制用横轴表示数据分组纵轴表示频数或频率直方图下的总面积等于1直方图

45462010人数(人)5060708090100成绩(分)图2-1直方图的绘制我一眼就看出来了,大多数人的成绩在70~80之间!

4647折线图折线图——也称次数多边形图(Frequencypolygon)折线图的绘制方法在直方图的基础上,把各条形顶部的中点用线段连接起来以各组组中值为横坐标,以各组次数为纵坐标,描出各点,依次将各点连接起来注意:折线图的两个终点要与横轴相交折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的

4748图2-2折线图的绘制2010人数(人)5060708090100成绩(分)

48495530累计人数(人)5060708090100成绩(分)图2-3折线图的绘制(累计分布)折线图可以用来表示累计分布次数,如向上累计分布曲线:

4950§2.3统计数据的显示§2.3.1统计表1.统计表的概念表现经过整理的统计数据的表格统计数据最规范的表现形式2.统计表的构成标题——总标题、横栏标题、纵列标题横行、纵列数字

5051表2-122011年我国城乡居民家庭人均收入及恩格尔系数家庭人均可支配收入恩格尔系数(%)绝对额(元)指数(1978=100)农村居民6977.31046.336.3城镇居民21809.81063.240.4总标题纵列标题数据横行标题资料来源:《国家统计数据》http://data.stats.gov.cn/workspace/index;jsessionid=A1EF35F4E8A8E6955673334D00CCEF9E?m=hgnd表外附加(表脚)

5152分组年份家庭人均可支配收入恩格尔系数(%)绝对额(元)指数(78=100)农村居民20052006200720082009201020113254.93587.04140.44760.65153.25919.06977.3624.5670.7734.4793.2860.6954.41063.245.543.043.143.741.041.140.4城镇居民200520062007200820092010201110493.011759.513785.815780.817174.719109.421809.8607.4670.7752.3815.7895.4965.21046.336.735.836.337.936.535.736.3

5253年份农村居民城镇居民人均可支配收入(元)指数(1978=100)恩格尔系数(%)人均可支配收入(元)指数(1978=100)恩格尔系数(%)20052006200720082009201020113254.93587.04140.44760.65153.25919.06977.3624.5670.7734.4793.2860.6954.41063.245.543.043.143.741.041.140.410493.011759.513785.815780.817174.419109.421809.8607.4670.7752.3793.2895.4965.21046.336.735.836.537.936.535.736.3

533.统计表的种类简单表分组标志多少 简单分组表复合分组表54

5455性别月平均通讯费(元)50以下50~6060~7070~8080~9090以上合计男1850521785150女2055571152150合计3810510928137300行是定性变量“性别”,列是定量变量“月平均通讯费”。4.列联表列联表又称为交叉表,它是由两个以上的变量进行交叉分类的频数分布表。

5556年龄与生死性别年龄与生死船舱等级与生死年龄遇难幸存合计性别遇难幸存合计舱级遇难幸存合计成人14386612099女1263444701122203325儿童5257109男136437417382167178285合计14907182208合计149071822083528178706船员673219892合计14907182208泰坦尼克的数据分析(2208人)(列联表与决策树)

56要合理安排统计表的结构总标题内容应满足3W要求(whatwherewhen)数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“——”表示必要时可在表的下方加上注释5.统计表的设计

57§2.3.2统计图1.柱形图2.饼图3.环形图4.线图5.雷达图6.茎叶图58

5859定性数据的整理与显示要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的对数据主要是做分类整理适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据

59601.定类数据的整理制作频数分布表用图形显示数据列出各类别计算各类别的频数

6061定类数据可计算的指标频数:落在各类别中的数据个数比重:某一类别数据占全部数据的比值比率:不同类别数值的比值

6162定类数据整理—频数分布表【例】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。广告类型人数(人)比重(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告1121651910256.08.025.54.55.01.0表2-9某城市居民关注广告类型的频数分布

6263定类数据的图示—条形图条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图

6364定类数据的图示—条形图人数(人)5191610211204080120商品广告服务广告金融广告房地产广告招生招聘广告其他广告广告类型图2-7某城市居民关注不同类型广告的人数分布

6465定类数据的图示—圆形图也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为3600×25.5%=91.80,其余类推

6566其他广告1.0%房地产广告8.0%商品广告56.0%金融广告4.5%服务广告25.5%招生招聘广告5.8%图2-8某城市居民关注不同类型广告的人数构成

66672.定序数据的整理累计频数:将各类别的频数逐级累加累计频率:将各类别的频率(百分比)逐级累加

6768定序数据频数分布表【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。表2-10甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————

6869表2-11乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0————

6970定序数据的图示—累计频数分布图243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向下累积27616830300750100200300400非常不满意不满意一般满意非常满意累积户数(户)(b)向上累积图2-9甲城市家庭对住房状况评价的累积频数分布

7071定序(类)数据的图示—环形图环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环环形图可用于进行比较研究环形图可用于展示定类和定序的数据

71728%36%31%15%7%33%26%21%13%10%非常不满意不满意一般满意非常满意图2-10甲乙两城市家庭对住房状况的评价

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭