资源描述:
《南华大学公共卫生学院卫生学课件计量资料的统计推断》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、计量资料的统计推断(4学时)吴成秋公共卫生学院预防医学系一、均数的抽样误差于标准误复习:几个基本该概念总体(population):有限总体:无限总体:样本(sample):代表性:可靠性:统计量(statistic):参数(parameter):抽样误差(samplingerror)抽样研究:统计推断:2.均数的抽样误差与标准误的概念从N(,2)的总体中做随机抽样,每次抽样样本含量为n,样本均数为x,标准差为s。如下:1nx1s1sx1t12nx2s2sx2t23nx3s3sx3t34nx4s4sx4t4
2、………………nx100s100sx100t100标准误用x表示,它是说明均数抽样误差的大小可知:每一个样本均数与不一定相等,它们之差别是由抽样所造成的;另外,这100个样本均数大小也不尽相同,它们之间的变异程度可以用样本均数的标准差来表示,即标准误(为了与反映个体变异的标准差相区别)从数学上可以证明:①从正态总体N(,2)中,随机抽取例数为n的样本,样本均数x也服从正态分布;既使从偏态分布总体抽样,当n足够大时,x也近似正态分布N(,2/n)。②从正态总体N(,2)或偏态分布总体抽样,随机抽取例数为n的样
3、本,样本均数x的总体均数也为,标准差为x,x=n3.标准误的计算在实际工作中,由于是未知,由上式不能求出标准误,因此,用样本标准差s来估计的大小。标准误(估计值)Sx=s.n固定时,标准差越大,标准误越大标准差固定时,n越大,标准误越小n3.标准误的计算例:某地成年男子红细胞的抽样调查,n=144,X=5.38×1012/L,S=0.44×1012/L,求其标准误。Sx=s/=0.44/=0.037(×1012/L)n144上述抽了100次样,可以求得100个Sx,均是x的估计值。实际工作中,只能根据一个
4、样本计数出一个标准误说明抽样误差的大小,作为X估计的可靠程度。4.标准误应用①标准误反映抽样误差的大小,Sx越大,抽样误差越大,X的代表性越差。②参数的估计③均数的假设检验二、t分布1.t分布的概念对于X~N(µ,)有u=(X-)/对于X~N(µ,x)有u=(X-)/xx是未知,常用Sx来代替。对于X~N(µ,x)有t=(X-)/sxu值的分布称为u分布(标准正态分布)t值的分布称t分布100次抽样,可以求得100个t值,100个t值编成频数表,可以绘制成频数分布图。由于sx受n的影响,严格讲,受(
5、n-1)的影响,(n-1)称为自由度。=n-1如下图。t分布的图形2.分布的特征(与正态分布比较)①单峰分布,以t=0为中点,两侧对称(高峰位置)②样本(自由度)越小,t分布曲线峰值越低,t值越分散(形状指标)③随着自由度的增大,t分布逐渐接近标准正态分布,当=∞时,t分布的极限分布是标准正态分布(与标准正态分布相比,t分布曲线高峰低,尾部较高)3.t界值表当一定时,t分布曲线下单侧或双侧的尾部面积为指定值时,横轴上相对应的t值记为t,有单、双侧t,之区分。如图。-t,0+t,/2/2-t,0
6、图中阴影部分表示t,以外尾部面积占总面积的百分数P意思是从正态整体中做随机抽样,得到样本t值落在该区间的概率.t界值表中:①同一时,t与P呈反向关系.t,>u②当相同时,单侧P与双侧2P对应相同的t界值,即单侧t,=双侧t2,③当=∞时,t=u三、总体均数的估计点估计(pointestimation):估计总体均数的具体数值大小,一般就用X代替的大小。该估计方法没有考虑抽样误差的大小,较少用。例:某抽样得X=165.0cm,=165.0cm.区间估计(intervalestimation):指用
7、X和Sx按一定的概率估计总体均数在哪一个范围,该区间包含总体均数的概率为1-,称为总体均数的1-可信区间。1-一般取0.95或0.99。单一总体均数可信区间(confidenceinterval,CI)①未知:按t分布②未知,n较大时总体均数的可信区间③已知2.两总体均数差的可信区间①(1-2)1-CI②n较大:(1-2)1-CI③(1-2)的单侧1-CI单一总体均数可信区间(confidenceinterval,CI)①未知:按t分布t≤-t,和t≥t,的概率为P(-t,≤t≤t,
8、)=1-P(-t,≤X-≤t,)=1-X-t,Sx≤≤X+t,Sx或X±t,SxSx例:已知某样本的X=5.04,s=0.44,n=10.试求该总体的正常成年男子平均红细胞计数的95%可信区间。解:=9,=