欢迎来到天天文库
浏览记录
ID:1143750
大小:457.50 KB
页数:18页
时间:2017-11-08
《05 参数估计基础new》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第五章参数估计基础[教学要求]了解:通过电脑实验了解抽样分布及t分布的特征,了解查表法估计总体概率的置信区间。熟悉:理解抽样误差的概念;熟悉标准误的意义及其应用。掌握:会计算均数及频率的标准误;掌握总体均数95%和99%置信区间的计算及适用条件;掌握正态近似法计算总体概率的95%和99%置信区间及适用条件;阐述标准差与均数标准误的区别。[重点难点]第一节抽样误差与标准误一、均数(频率)的抽样分布及抽样误差基本概念:在同一总体中反复多次随机抽取样本含量相同的若干样本,由于个体差异与偶然性的影响,样本统计量之间以及样本统计量与总体参数之间的差异,称为抽样误差
2、。这种由抽样造成的均数之间的差异称为均数的抽样误差,频率之间以及频率与概率之间的差异称为频率的抽样误差。特点:从正态分布N(μ,σ2)总体中抽样,样本均数仍服从正态分布;从非正态分布总体抽样,只要从偏态均数为m,方差为的一般总体抽样,样本量足够大(n³50),样本均数的分布也近似于正态分布。在抽样研究中,抽样误差是不可避免的。用来表示抽样误差大小的指标称为标准误。二、标准误18(一)均数标准误意义:均数标准误用符号表示,也称样本均数的标准差。它反映了样本均数之间、样本均数与总体均数之间的离散程度,也反映了样本均数抽样误差的大小。计算:可按公式计算。在实际
3、应用中,一般不直接考察总体,所以总体标准差s常常未知,需要用样本标准差s来估计。此时,均数标准误的估计值为。由此式可见,若增加样本含量n可以减小样本均数的抽样误差。主要应用:①估计总体均数的置信区间;②均数的假设检验。在指标的意义、计算及结果解释方面注意与标准差区别,不能将两者混淆。(二)频率的标准误意义:频率的标准误用符号sp表示,它反映了样本频率与样本率样本频率之间、样本率样本频率与总体率总体概率之间的离散程度,也反映了样本频率抽样误差的大小。计算:可按公式sp=计算。在实际应用中,总体概率p常常未知,需要用样本频率p作为总体概率p的估计值,因此频率
4、的标准误的估计值为。由此式可见,增加样本含量n可以减小样本频率的抽样误差。主要应用:①估计总体概率的置信区间;②频率指标的假设检验。18第一节t分布一、t分布的概念服从自由度n=n-1的t分布。t分布是总体均数的区间估计及假设检验的理论基础。二、t分布的图形与曲线下面积分布规律t分布与标准正态分布相比,其分布密度有如下特征:①单峰分布,以0为中心,左右对称;②自由度n越小,则越大,t值越分散,曲线的峰部越矮,尾部越高;③自由度n逐渐增大时,t分布逐渐逼近标准正态分布;当n趋于¥时,t分布就完全成为标准正态分布。按t分布的规律,密度曲线下面积分布规律为:单
5、侧:P(t£-ta,n)=a或P(t³ta,n)=a双侧:P(t£-ta/2,n)+P(t³ta/2,n)=a第二节总体均数及总体概率的估计一、参数估计的概念参数估计是指用样本指标(统计量)估计总体指标(参数)。参数估计有点估计和区间估计两种方法。(一)点估计直接用随机样本的样本均数作为总体均数m的估计值或用样本频率p作为总体概率p的估计值的方法称为点估计。这是一种没有考虑抽样误差的简单估计方法。(二)区间估计18用已知样本统计量和标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间(confidenceinterv
6、al,CI),这一估计可相信的程度称为置信度或置信水平(如95%或99%)。若标准差不变,置信度由95%提高到99%,可信区间置信区间便由窄变宽,估计的精度下降。二、置信区间的计算(一)正态分布总体均数的置信区间总体均数置信区间的基本公式是±ta/2,n。样本量较大时,可以是±uZa/2或±Za/2(若总体标准差已知)。实际工作中,估计总体均数置信区间时,要注意与参考值范围区别,见《卫生统计学》教材表5-4中内容。(二)二项分布总体概率的置信区间根据样本含量n和样本频率p的大小,可以采用查表法和正态近似法。重点掌握正态近似法。正态近似法:当n足够大,且样
7、本频率p和(1-p)均不太小时,如np与n(1-p)均大于5,p的抽样分布接近正态分布,此时总体概率的置信区间为(p-Za/2Sp,p+Za/2Sp),缩写为p±Za/2Sp。[案例讨论参考答案](1)根据专业知识和《卫生统计学》第五章表5.3中的200名正常成年人血铅值的频数分布可知该资料属于正偏峰分布。用正态分布法+1.64S估计正常成年人血铅值的95%参考值范围不合适,因为算术均数18常用于描述正态资料的平均水平,而+1.64S是以正态曲线下面积的分布规律估计正态资料95%的观察值所在范围单侧上界。对于正偏峰分布的资料,一般用中位数M或几何均数G来
8、描述其平均水平,并用百分位数法或将数据经对数变换后用正态分布法来估计正常成年人血
此文档下载收益归作者所有