欢迎来到天天文库
浏览记录
ID:39293480
大小:1.83 MB
页数:29页
时间:2019-06-29
《2.2.2用样本的数字特征估计总体》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2.2.2用样本的数字特征估计总体的数字特征善于奋飞的人天上有路,敢于攀登的人山中有路,勇于远航的人海里有路,勤于学习的人脚下有路!主备人:王朝远张洪华审核人:牟必继【复习引入】1、频率分布直方图2、频率分布折线图3、总体密度曲线4、茎叶图我们学习了用图、表来组织数据,以及通过图、表提供的的信息,用样本的频率分布估计总体的分布.为了更好的把握总体的规律,还需要通过样本的数据对总体的数字特征进行研究。探究1:某学校高一甲班和高一乙班各有49名学生,两班在一次数学测试中的成绩统计如下:班级平均分众数中位数标准差甲
2、班79708719.8乙班7970795.2【探究新知】(1)请你对下面的一段话给予简要分析:甲班的小刚对妈妈说:“昨天的数学测验,全班平均分79分,得70分的人最多,我得了85分,在班里算是上游了!”(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.解:(1)甲班49名学生数学成绩的中位数是87,则85分排在全班第25名之后,从位次上看应该属于中游.但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握较好,从掌握学习的内容上讲,也可以说属于上游;(2)甲班成绩的
3、中位数是87分,说明高于87分的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.乙班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学生优异的也少,建议采取措施提高优秀率.班级平均分众数中位数标准差甲班79708719.8乙班7970795.2名称定义特征众数一组数据中出现次数最多的数(1)反映了数据的集中趋势;(2)只能表达样本数据很少的一部分信息,无法客观反映总体特征中位数一组数据按大小依次排列,中间位置的一个数(
4、或中间两个数的平均数)(1)反映了数据的集中趋势;(2)不受少数极端值的影响,但对极端值不敏感平均数一组数据的和与这组数据的个数的商(1)反映了数据的平均水平;(2)反映出更多的关于样本数据全体的信息;(3)受少端值的影响较大,任何一个数据的改变都会引起平均数的改变1、众数、中位数、平均数练习:平均数中位数众数他们分别是多少?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O探究2:下图是城市居民月均用水量样本数据的频率分布直方图,如何从频率分布直方图中估计众数、中位数
5、、平均数?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O取最高矩形中点的横坐标2.25作为众数.(1)你认为众数应在哪个小矩形内?由此估计总体的众数是什么?(2)直方图中,从左至右各个小矩形的面积分别是:0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.中位数左右两侧的直方图的面积有什么关系?由此估计总体的中位数是什么?0.5-0.04-0.08-0.15-0.22=0.01,0.01÷0.5=0.02,中位数是2.02.月均
6、用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O(3)平均数是频率分布直方图的“重心”,由此估计总体平均数为多少?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O平均数的估值=频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02(t)
7、.(4)从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,损失了一些样本数据,得到的是一个估计值,且所得估计值与数据分组有关.因此,在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.归纳比较:三种数字特征的优缺点1.众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上
8、例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少。2.中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。3.由于平均数与每一个
此文档下载收益归作者所有