资源描述:
《《统计量及其分布》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、5.3统计量及其分布5.3.1统计量及其分布定义5.3.1统计量:设x1,x2,…,xn为取自某总体的样本,若样本函数T=T(x1,x2,…,xn)中不含有任何未知参数,则称T为统计量.抽样分布:统计量的分布成为抽样分布.注:统计量不依赖于未知参数,但是它的分布一般是依赖与未知参数的.5.3.2样本均值及其抽样分布定义5.3.2设x1,x2,…,xn为取自某总体的样本,其算术平均值称为样本均值,一般用表示,即在分组样本场合,样本均值的近似公式为其中k为组数,xi为第i组的组中值,fi为第组的频数.例5.3.1某
2、单位收集到20名青年人的某月的娱乐支出费用数据:79848488929394979899100101101102102108110113118125则该月这20名青年的平均娱乐支出为将这20个数据分组可以得到如下频数频率分布:组序分组区间组中值频数频率定理5.3.1若把样本中的数据与样本均值之差称为偏差,则样本所有偏差之和为0,即定理5.3.2数据观察值与均值的偏差平方和最小,即在形如的函数中,最小,其中为任意给定常数.证明:为任意给定常数c定理5.3.3设x1,x2,…,xn是来自某个总体的样本,为样本均值1
3、)若总体分布为,则2)若总体分布未知或者不是正态分布,但则n较大时证明:1)证明见p210,习题13.(提示:用特征函数的性质证)2)由中心极限定理,例5.3.3求样本容量为30,总体分布如下的样本均值的渐进分布:1)总体分布为均匀分布U(1,5);2)总体分布密度函数为(倒三角分布)3)总体分布为指数分布Exp(1);解:1)均匀分布U(1,5)的均值和方差分别为3和4/3,所以样本均值的渐进分布为2)容易算出该分布均值和方差分别为3和2,所以样本均值的渐进分布为3)指数分布Exp(1)的均值和方差都为1,所
4、以样本均值的渐进分布为5.3.3样本方差和样本标准差称为样本方差.称为样本标准差.也称为样本方差(也称无偏方差)也称为样本标准差..不大时常用在定义5.3.3设x1,x2,…,xn是来自某个总体的样本,则它的平均偏差平方和:关于样本均值说明:称为偏差平方和的自由度自由度的含义是:个偏差中只有个数据可以自由变动,而第个则不能自由取值,因为分组样本场合,样本方差的近似计算公式为练习:例5.3.4定理5.3.4设总体X具有二阶矩,即x1,x2,…,xn为从总体得到的样本,则:证明:5.3.4样本矩及其函数定义5.3
5、.4设x1,x2,…,xn是样本,则统计量称为样本阶原点矩称为样本阶中心矩,,是样本矩吗?请回答:定义5.3.5设x1,x2,…,xn是样本,则统计量称为样本偏度.说明:反映了总体分布密度曲线的对称性信息.1、是个相对数,刻画了数据分布的偏斜方向和程度.2、说明数据是对称的.称为样本偏度.说明数据中有几个较大的数,反映总体分布是正偏的或右偏的.说明数据中有几个较小的数,反映总体分布是负偏的或左偏的.定义5.3.6设x1,x2,…,xn是样本,则统计量称为样本峰度.5.3.5次序统计量及其分布一、次序统计量的定
6、义及性质例5.3.6设总体X的分布为仅取0,1.2的离散均匀分布,分布列为x012p1/31/31/3现从中抽取容量为3的样本,其一切可能取值有将它们列在下表左侧,其右侧是相应的次序统计量观测值。0000001200120010012100120100010220221000012020220020022200220200021121122000021211120110112111121010111221221100112121220120122211220210121111111020122222222010
7、12二、次序统计量的抽样分布练习:请写出最小次序统计量和最大次序统计量的密度函数.(p157)例5.3.7中抽得一个容量为5的样本,试计算现从该总体设总体密度函数为解:由总体密度函数求出总体分布函数为:例5.3.8这正是的分布.设总体分布为例5.3.9设总体分布为5.3.6样本中位数与样本分位数5.3.7五数概括与箱线图所谓五数概括就是用这五个数来大致描述一批数据的轮廓5.3.7五数概括与箱线图一、单批数据箱线图二、多批数据箱线图用箱线图初步考察测验成绩的分布sas程序如下:1)单批数据箱线图2)多批数据箱线
8、图对于多批数据,我们可以将各批数据的箱线图并列起来,从而进行分布特征的比较.sas程序如下:作业题:必做:11、14、18、23选做:19、24