资源描述:
《07统计表与统计图》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第7讲统计表与统计图一、基础知识(一)频率分布表1.频率分布表:我们把反映总体频率分布的表格称为频率分布表。2.制作频率分布表(1)求全距,决定组数和组距,;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组去闭区间;(3)登记频数,计算频率,列出频率分布表。说明:①全距:整个取值区间的长度;②组距:分成的区间的长度③一般情况下,分组时除最右边的区间是闭区间外,其他区间均为左闭右开区间,称区间的左端点为下组限,右端点为上组限。当然,也可以采用左开右闭区间形式。90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组
2、距0.0320.036(二)、频率分布直方图与折线图1.频率分布直方图:能够反映样本的频率分布规律的直方图说明:频率分布直方图的特征:①从频率分布直方图可以清楚的看出数据分布的总体趋势。②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。2.频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图,简称频率折线图。注意:取值区间两端点须分别向外延伸半个组距,并取此组距上在x轴上的点与折线首尾相连。3.总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,则相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线
3、为总体分布的密度曲线。(三)、茎叶图:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎叶图的特征:(1)茎叶图一般左侧的叶从大到小写,右侧的按从小到大的顺序写,相同的数据要重复纪录,不得遗漏。(2)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。(3)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能
4、够记录,但是没有表示两个记录那么直观,清晰(四)、统计学中的数字特征1.众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数。91.中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数.说明:中位数则仅与数据排列位置有关,当一组数据从小到大排列后,最中间的数据为中位数(偶数个数据的最中间两个的平均数)。因此某些数据的变动对它的中位数影响不大。当一组数据中的个别数据变动较大时,可用它来描述其集中趋势。2.平均数:4.标准差5、方差:从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和
5、标准差是一样的,但在解决实际问题时,一般多采用标准差。二、例题分析:例1:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)列出样本频率分布表﹔(2)估计身高小于134cm的人数占总人数的百分比.。例2、,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,7,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?9例3、(广东卷11).为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的
6、数量.产品数量的分组区间为,由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在的人数是 .例4、为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0,27,78B.0,27,83C.2.7,78D.2.7,830.30.14.34.44.54.64.74.84.95.05.15.2视力例4(2010四川文数)(4)一个单位有职工800人,期中具有高级职称的160人,具有
7、中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是(A)12,24,15,9(B)9,12,12,7)8,15,12,5(D)8,16,10,6例5、(2009年广东卷文)某单位200名职工的年龄分布情况如图2,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为