样本数据的整理与显

样本数据的整理与显

ID:46791024

大小:260.66 KB

页数:13页

时间:2019-11-27

样本数据的整理与显_第1页
样本数据的整理与显_第2页
样本数据的整理与显_第3页
样本数据的整理与显_第4页
样本数据的整理与显_第5页
资源描述:

《样本数据的整理与显》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二节样本数据的整理与显示1、经验分布函数2、频数频率分布表3、样本数据的图形显示1.定义一、经验分布函数则称Fn(x)为该样本的经验分布函数.定义:用有序样本定义如下函数:例1某厂生产听装饮料,现从生产线上随机抽取5听饮料,称其净重量(单位:g)如下:351,347,355,344,351,求经验分布函数。注:其图形呈阶梯形、右连续.解:经排序得x(1)=344,x(2)=347,x(3)=x(4)=351,x(5)=355注1:当x1,…xn的值固定时(从而x(1),…,x(n)给定),作为x的函数Fn(x)是一个非

2、减右连续函数,且满足因此Fn(x)是一个分布函数。注2:对每个固定的x,Fn(x)作为样本的函数,是一个随机变量。对固定的x,Fn(x)为事件“X≤x”在n次独立重复试验中发生的频率,于是由Bernoulli大数定律:只要n充分大,Fn(x)依概率收敛于总体分布函数F(x).且呈阶梯形,期间断点就是x(k)处(k=1,…,n).若有l个x(k)相同,则Fn(x)在x(k)处有跃度l/n.定理1(格里纹科定理)注:该定理表明:只要n充分大,经验分布数Fn(x)是总体分布函数F(x)的良好近似.在经典统计学中,这是用样本来推

3、断总体的理论依据.二、频数/频率分布表整理数据的常用方法是根据数据给出频数/频率分布表步骤如下:Step1对样本值进行分组:确定组数k(一般5~20组).Step2确定每组组距(等距):组距Step4统计样本值落入各区间的频数,并求出频率。Step3确定每组组限:选取a(略小于)和b(略大于),分区间(a,b]为k等份例3的频数频率分布表如下:将数据分成五组:(左开右闭区间)其中频率是频数除以总频数。累积频率是指相应的组频率之和。为了直观,一般用直方图表示。1.频率直方图(frequencyhistogram)以“变量”

4、为横轴,以“频率”为纵轴画柱形图,即得频率直方图.(若以“频率/组距”为纵坐标,则为单位频率直方图,再画平滑直线图即得总体X的密度近似曲线)三、样本数据的图形显示体重240039000频率(%)/3003300把每一个数值分为两部分,前面一部分(比如百位和十位)称为茎,后面部分(比如个位)称为叶,然后画一条竖线,在竖线的左侧写上茎,右侧写上叶,就形成了茎叶图。如:数值分开茎和叶11211

5、211和22.茎叶图(stem-and-leafdisplays)茎叶图既展示了分布形状又有原始数据。它象一片带有茎的叶子。茎为较

6、大的数目,叶为较小的数目。例4.对应聘人员成绩进行考察,30人得分情况如下。64,67,70,72,74,76,76,79,80,81,82,82,83,85,86,88,91,91,92,93,93,93,95,95,95,97,97,99,100,100102,104,106,106,107,108,108上述数据可以用茎叶图来表示,左侧数字表示得分的百位及十位数,右侧数字表示个位数。6789104702466901223568112333566779002466788例5.某赛季甲、乙两名篮球运动员每场比赛得分情况

7、如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50乙的得分:8,13,14,16,23,26,28,33,38,39,51。上述数据可以用茎叶图来表示,中间数字表示得分的十位数,两边数字分别表示两个人各场比赛得分的个位数。当比较两组样本时,可画出它们的背靠背的茎叶图。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。