资源描述:
《221用样本的频率分布估计总体分布》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、用样本的频率分布估计总体分布某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费.(1)如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?(2)为了较合理地确定这个标准,你认为需要做哪些工作?3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.4
2、2.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2这些数字告诉我们什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:很容易发现的是一个居民月平均用水量的最小值时0.2t,最大值是4.3t,其他在0.2t~4.3t之间.分析数据的一种基本方
3、法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布情况.频率分布表和频率分布直方图(1)求极差(一组数据中的最大值与最小值的差).例如,4.3-0.2=4.1,说明样本数据的变化范围是4.1(t).(2)决定组距与组数.设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1.为方便其间,组距的选择应力求“取整”
4、.在本问题中,如果取组距为0.5(t),那么组数=极差÷组距=4.1÷0.5=8.2,因此可以将数据分为9组,这个组数是比较合适的,于是取组距为0.5,组数为9.(4)列频率分布表.计算各小组的频率,作出下面的频率分布表.(频数=样本数据落在各小组内的个数,频率=频数÷样本容量)(3)将数据分组.以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5].列频率分布表:分组频数累计频数频率[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计4
5、8152225146420.040.080.150.220.250.140.060.041001.00频率=样本容量频数注意频数的合计应是样本容量,频率合计应是1.0.02频率/组距0.080.160.300.440.500.280.120.080.04频率分布表一般分“分组”,“频数累计”(可省),“频数”,“频率”,“频率/组距”五列,最后一行是合计(5)画频率分布直方图.根据频率分布表可以得到如图所示的频率分布直方图:月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234提升总结:频率分布直方图第一步
6、:画平面直角坐标系.第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步:以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图来反映样本的频率分布.月均用水量/t频率/组距0.50.40.30.20.10.511.522.533.544.5O各组的频率在图中哪里显示出来?各小长方形的面积=频率.各小长方体的面积之和是否为定值?各小长方形的面积之和为1.宽度:组距高度:频率组距月均用水量/t0.50.40.30.20.10.511.522.533.544.5O你
7、能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?频率/组距(1)居民月均用水量的分布是呈“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性.频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民在3t以下,标准可定为3t.在实际中,取
8、a=3t一定能保证85%以上的居民用水不超标吗?在实践中,对统计结