欢迎来到天天文库
浏览记录
ID:18194768
大小:243.00 KB
页数:12页
时间:2018-09-15
《2.2.1《用样本的频率分布估计总体分布》》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
2.2.1《用样本的频率分布估计总体分布》【学习目标】1.通过实例体会分布的意义和作用;2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。【重点难点】教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图教学难点:能通过样本的频率分布估计总体的分布【知识链接】说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。类别共同点各自特点联系适用范围简单随机抽样(1)抽样过程中每个个体被抽到的可能性相等[来源:www.shulihua.net](2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取[来源:www.shulihua.net][来源:www.shulihua.net]总体个数较少系统抽样[来源:www.shulihua.netwww.shulihua.net]将总体均分成几部分,按预先制定的规则在各部分抽取在起始部分样时采用简随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成【引入】在统计中,为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况。这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。下面我们先通过案例来介绍总体分布的估计。【学习过程】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。(见课本表2-1)分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。一、频率分布直方图 频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数,(3)将数据分组(4)列频率分布表(5)画频率分布直方图以课本制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。思考探究:(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(3)如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-1和频率分布直方图2.2-1,(见课本)你能对制定月用水量标准提出建议吗?二、频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。2.总体密度曲线的定义:在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本)思考探究:(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?(2)对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?答:实际上,尽管有些总体密度曲线是客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。三.茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子)2.茎叶图的特征: (1)用茎叶图表示数据的优点:一是既可以看出样本的分布情况又能看到原始数据;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。【例题精析】例1、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)列出样本频率分布表;(2)画出频率分布直方图;(3)画出频率分布折线图;(4)估计身高小于134cm的人数占总人数的百分比.。分析:根据样本频率分布表、频率分布直方图的一般步骤解题。解:(1)样本频率分布表如下:(2、3)其频率分布直方图如下:(4)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%. 变式训练:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:由频率=,90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036得(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。例2、从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班:76,74,82,96,66,76,78,72,52,68乙班:86,84,62,76,78,92,82,74,88,85画出茎叶图并分析两个班学生的数学学习情况。解析:由茎叶图可知,乙班的成绩较好,而且较稳定。【学习反思】1、制作频率分布直方图分几个步骤?各步骤需要注意哪些问题? 2、频率分布直方图和茎叶图相比有什么特点?答:1、步骤:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数,(组距是人为决定的)(3)将数据分组(4)列频率分布表(必须包括分组、频数、频率三部分)(5)画频率分布直方图(注意纵坐标表示什么,各小长方形是连在一起的)3、频率分布直方图无法看到原始数据,而茎叶图能看出原始数据;但频率分布直方图所体现的内容比茎叶图多。【书面作业】导学案【拓展提升】 2.2.1《用样本的频率分布估计总体分布》导学案【学习目标】1.通过实例体会分布的意义和作用;2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。【重点难点】重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图难点:能通过样本的频率分布估计总体的分布【学法指导】一、预习目标:在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;二、预习内容:阅读课本~三.完成下列问题:1.一般用频率分布直方图反映样本的频率分布。其一般步骤有哪些?频率分布直方图的特征是什么?2.茎叶图的特征是什么?【知识链接】说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。类别共同点各自特点联系适用范围简单随机抽样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取总体个数较少系统抽样将总体均分成几部分,按预先制定的规则在各部分抽取在起始部分样时采用简随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成【新知探究】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作? 【学习过程】一、频率分布直方图1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:2.以课本制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。3.频率分布直方图的特征:思考探究:(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(3)如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-1和频率分布直方图2.2-1,(见课本)你能对制定月用水量标准提出建议吗?二、频率分布折线图、总体密度曲线1.频率分布折线图的定义:2.总体密度曲线的定义:在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本)思考探究:(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?(2)对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?三.茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子)2.茎叶图的特征:典型例题例1、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm) (1)列出样本频率分布表;(2)画出频率分布直方图;(3)画出频率分布折线图;(4)估计身高小于134cm的人数占总人数的百分比.。变式训练:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。例2、从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班:76,74,82,96,66,76,78,72,52,68乙班:86,84,62,76,78,92,82,74,88,85画出茎叶图并分析两个班学生的数学学习情况。 【基础达标】1.为了解一批数据在各个范围内所占的比例大小,将这批数据分组,落在各个小组里的数据个数叫做()A、频数B、样本容量C、频率D、频数累计2.在频率分布直方图中,各个小长方形的面积表示()A、落在相应各组的数据的频数B、相应各组的频率C、该样本所分成的组数D、该样本的容量3.列样本频率分布表时,决定组数的正确方法是()A、任意确定B、一般分为5—12组C、由组距和组数决定D、根据经验法则,灵活掌握4.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0、125,则n的值为()A、640B、320C、240D、1605.为考察某种皮鞋的各种尺码的销售情况,以某天销售40双皮鞋为一个样本,把它按尺码分成5组,第3组的频率为0、25,第1,2,4组的频率分别为6,7,9,若第5组表示的是40—42码的皮鞋,则售出的200双皮鞋中含40—42码的皮鞋为()A、50B、40C、20D、306.一个容量为20的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],4;(60,70],2。则样本在区间(-,50]上的频率是()A、5%B、25%C、50%D、70%7.将一批数据分成5组列出频率分布表,其中第1组的频率是0、1,第4组与第5组的频率之和是0、3,那么第2组与第3组的频率之和是。【学习反思】【拓展提升】1.从一群学生中收取一个一定容量的样本对他们的学习成绩进行分析,前三组是不超过80分的人,其频数之和为20人,其频率之和(又称累积频率)为0、4,则所抽取的样本的容量是()A、100B、80C、40D、502.下列叙述中正确的是()A、从频率分布表可以看出样本数据对于平均数的波动大小B、频数是指落在各个小组内的数据C、每小组的频数与样本容量之比是这个小组的频率D、组数是样本平均数除以组距3.有一个数据为50的样本数据分组,以及各组的频数如下,根据累积频率分布,估计小于30的数据大约占多少() [12、5,15、5),3;[15、5,18、5),8;[18、5,21、5),9;[21、5,24、5),11;[24、5,27、5),10;[30、5,33、5),4A、10%B、92%C、5%D、30%4.在抽查某产品尺寸的过程中,将其尺寸分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率为m,该组上的直方图的高是h,则,[a-b]等于()A、hmB、C、D、与m,h无关5.已知一个样本75,71,73,75,77,79,75,78,80,79,76,74,75,77,76,72,74,75,76,78。在列频率分布表时,如果组距取为2,那么应分成组,第一组的分点应是—,74、5—76、5这组的频数应为,频率应为。6.在求频率分布时,把数据分为5组,若已知其中的前四组频率分别为0、1,0、3,0、3,0、1,则第五组的频率是,这五组的频数之比为。7.为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组及频率如下表:分组频数频率[10、75,10、85)3[10、85,10、95)9[10、95,11、05)13[11、05,11、15)16[11、15,11、25)26[11、25,11、35)20[11、35,11、45)7[11、45,11、55)4[11、55,11、65)2合计100完成上面的频率分布表;根据上表画出频率分布直方图;根据上表和图,估计数据落在[10、95,11、35)范围内的概率约是多少?数据小于11、20的概率约是多少?
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处