资源描述:
《概率论与数理统计 --- 第六章{样本及抽样分布} 第二节:样本分布函数&直方图》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二节样本分布函数直方图样本分布函数直方图我们把总体的分布函数F(x)=P(X≤x)称为总体分布函数.从总体中抽取容量为n的样本得到n个样本观测值,若样本容量n较大,则相同的观测值可能重复出现若干次,为此,应当把这些观测值整理,并写出下面的样本频率分布表:一、样本分布函数(sampledistributionfunction)观测值…总计频数…频率…1其中1.定义:设函数:其中和式是对小于或等于x的一切x(i)的频率fi求和,则称Fn(x)为样本分布函数,经验分布函数。(4)Fn(x)在每个观测值x(i)处是右连续的,点x(i)是Fn(x)
2、的跳跃间断点,Fn(x)在该点的跃度就等于频率fi样本分布函数Fn(x)的图形(2)Fn(x)是非减函数(1)0≤Fn(x)≤12.样本分布函数Fn(x)具有下列性质:对于任意的实数x总体分布函数F(x)是事件X≤x的概率;样本分布函数Fn(x)是事件X≤x发生的频率.根据伯努利大数定理可知,当n→∞时,对于任意的正数ε,有:格利文科(Glivenko)进一步证明了,当n→∞时,样本分布函数Fn(x)与总体分布函数F(x)之间存在着更密切的近似关系的结论.这些结论就是我们在数理统计中可以依据样本来推断总体的理论基础.作样本的频率直方图(简称
3、直方图),步骤如下:1.找出样本观测值x1,x2,…,xn中的最小值与最大值,分别记作x1*与xn*,即:2.适当选取略小于x1*的数a与略大于xn*的数b,并用分点:a=t04、摆动而使分布显得杂乱,太少则难于显示分布的特征。第i个子区间的长度为:此外,为了方便起见,分点ti应比样本观测值xi多取一位小数.4.在Ox轴上截取各子区间,并以各子区间为底,以fi/(ti-ti-1)为高作小矩形,各个小矩形的面积∆Si就等于样本观测值落在该子区间内的频率,所有小矩形的面积的和:这样作出的所有小矩形就构成了直方图。因为样本容量n充分大时,随机变量X的取值落在各个子区间(ti-1-ti)内的频率近似等于其概率,即:3.把所有样本观测值逐个分到各子区间内,并计算样本观测值落在各子区间内的频数ni及频率:即:所以直方图大致地描述
5、了总体X的概率分布。例2:测量100个某种机械零件的质量,得到样本观测值如下(单位:g):246251259254246253237252250251249244249244243246256247252252250247255249247252252242245240260263254240255250256246249253246255244245257252250249255248258242252259249244251250241253250265247249253247248251251249246250252256245254
6、258248255251249252254246250251247253252255254247252257258247252264248244写出零件质量的频率分布表并作直方图。解:因为样本观测中最小值为237,最大值为265,所以我们把数据的分布区间确定为:(236.5,266.5)并把这个区间等分为10个子区间:(236.5,239.5),(239.5,242.5),…,(263.5,266.5)由此得到零件质量的频率分布表:总计1001.00直方图如图所示:作业习题6-21