欢迎来到天天文库
浏览记录
ID:47877831
大小:116.32 KB
页数:21页
时间:2019-11-17
《参数估计基础》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第五章参数估计基础[教学要求]了解:通过电脑实验了解抽样分布及/分布的特征,了解查表法估计总体概率的置信区间。熟悉:理解抽样误差的概念;熟悉标准误的意义及其应用。掌握:会计算均数及频率的标准误;掌握总体均数95%和99%置信区间的计算及适用条件;掌握止态近似法计算总体概率的95%和99%置信区间及适用条件;阐述标准差与均数标准误的区别。[重点难点]第一节抽样误差与标准误一、均数(频率)的抽样分布及抽样误差基本概念:在同一总体屮反复多次随机抽取样本含量札I同的若干样本,由于个体差异与偶然性的彩响,样本统计量之间以及样本统计量与总体参数Z间的差异,称为抽样误差。这种由抽样造成的均
2、数Z间的差异称为均数的抽样误差,频率之间以及频率与概率之间的差异称为频率的抽样误差。特点:从正态分布N5,/)总体中抽样,样本均数乂仍服从正态分布;从非正态分布总体抽样,只要样本量足够大(n>50),样本均数的分布也近似于正态分布。在抽样研究中,抽样误差是不可避免的。用来表示抽样误差大小的指标称为标准误。二、标准误(一)均数标准误意义:均数标准误用符号餐表示,也称样本均数的标准差。它反映了样本均数之间、样本均数与总体均数之间的离散程度,也反映了样本均数抽样误差的大小。计算:可按公式3、计值为s十早。由此式可见,若增加样本含量n可以减小样本均数的抽样误差。主要应用:①估计总体均数的置信区间;②均数的假设检验。在指标的意义、计算及结果解释方面注意与标准差区别,不能将两者混淆。(二)频率的标准误意义:频率的标准误用符号6表示,它反映了样本频率与样本频率之间、样本频率与总体概率之间的离散程度,也反映了样本频率抽样误差的大小。计算:可按公式6二、巨匚可计算。在实际应用中,总体概率龙常常Vn未知,需要用样本频率Q作为总体概率兀的估计值,因此频率的标准误的估计值为s=pHHo由此式可见,增加样本含量〃可以减小样PVn-lVn本频率的抽样误差。主要应用:①估计总体概率的置4、信区间;②频率指标的假设检验。第二节t分布(分布的概念心口二T服从自由度r=/t-1的f分布。S元S丨Qn/分布是总体均数的区间估计及假设检验的理论基础。二、/分布的图形与曲线下面积分布规律t分布与标准正态分布相比,其分布密度有如下特征:①单峰分布,以0为中心,左右对称;②自由度“越小,则Sy越大,T值越分散,曲线的峰部越矮,尾部越高;③自由度V逐渐增大时,分布逐渐逼近标准正态分布;当"趋于00时,(分布就完全成为标准正态分布。按方分布的规律,密度崩线下面积分布规律为:单侧:P£_taJ二a或戶(tnta,v)=a双侧:P(t<一切2,J+P(t>切2,v)二Q第三节总体均数5、及总体概率的估计一、参数估计的概念参数估计是指用样本指标(统计量)估计总体指标(参数)。参数估计有点估计和区间估计两种。(―)点估计直接用随机样木的样本均数乂作为总体均数”的估计值或用样本频率0作为总体概率兀的估计值的方法称为点估计。这是一种没有考虑抽样误差的简单估计方法。(二)区间估计用已知样本统计量和标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间(confidenceinterval,CI),这一估计可相信的程度称为置信度或置信水平(如95%或99%)o若标准差不变,置信度由95%提高到99%,置信区间便由窄变宽,估计的精度下降6、。二、置信区间的计算(-)正态分布总体均数的置信区间总体均数置信区间的基本公式是X±vS.。样本量较大时,可以是乂土z刃2S丘或片±z切2畋(若总体标准差已知)。实际工作中,估计总体均数置信区间时,要注意与参考值范围区别,见《卫生统计学》教材表5-4中内容。(二)二项分布总体概率的置信区间根据样本含量n和样本频率p的大小,可以采用查表法和止态近似法。重点掌握正态近似法。正态近似法:当刀足够大,且样本频率刀和(1-p)均不太小时,如"与刀(1-P)均大于5,P的抽样分布接近正态分布,此吋总体概率的置信区间为(刀-Z^Sp,p+Z血Sp缩与为门±o[案例讨论参考答案](1)根据专7、业知识和《卫生统计学》第五章表5.3中的200名正常成年人血铅值的频数分布可知该资料属于止偏峰分布。用止态分布法X+1.64S估计止常成年人血铅值的95%参考值范围不合适,因为算术均数乂常用于描述正态资料的平均水平,而X+1.64S是以匸态曲线下面积的分布规律估计正态资料95%的观察值所在范围单侧上界。对于正偏峰分布的资料,一般用中位数M或几何均数G来描述其平均水平,并用百分位数法或将数据经对数变换后用止态分布法来估计正常成年人血铅值的95%参考值范围。本资料用百分位数法计算,得到正常成年人血铅值的95
3、计值为s十早。由此式可见,若增加样本含量n可以减小样本均数的抽样误差。主要应用:①估计总体均数的置信区间;②均数的假设检验。在指标的意义、计算及结果解释方面注意与标准差区别,不能将两者混淆。(二)频率的标准误意义:频率的标准误用符号6表示,它反映了样本频率与样本频率之间、样本频率与总体概率之间的离散程度,也反映了样本频率抽样误差的大小。计算:可按公式6二、巨匚可计算。在实际应用中,总体概率龙常常Vn未知,需要用样本频率Q作为总体概率兀的估计值,因此频率的标准误的估计值为s=pHHo由此式可见,增加样本含量〃可以减小样PVn-lVn本频率的抽样误差。主要应用:①估计总体概率的置
4、信区间;②频率指标的假设检验。第二节t分布(分布的概念心口二T服从自由度r=/t-1的f分布。S元S丨Qn/分布是总体均数的区间估计及假设检验的理论基础。二、/分布的图形与曲线下面积分布规律t分布与标准正态分布相比,其分布密度有如下特征:①单峰分布,以0为中心,左右对称;②自由度“越小,则Sy越大,T值越分散,曲线的峰部越矮,尾部越高;③自由度V逐渐增大时,分布逐渐逼近标准正态分布;当"趋于00时,(分布就完全成为标准正态分布。按方分布的规律,密度崩线下面积分布规律为:单侧:P£_taJ二a或戶(tnta,v)=a双侧:P(t<一切2,J+P(t>切2,v)二Q第三节总体均数
5、及总体概率的估计一、参数估计的概念参数估计是指用样本指标(统计量)估计总体指标(参数)。参数估计有点估计和区间估计两种。(―)点估计直接用随机样木的样本均数乂作为总体均数”的估计值或用样本频率0作为总体概率兀的估计值的方法称为点估计。这是一种没有考虑抽样误差的简单估计方法。(二)区间估计用已知样本统计量和标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间(confidenceinterval,CI),这一估计可相信的程度称为置信度或置信水平(如95%或99%)o若标准差不变,置信度由95%提高到99%,置信区间便由窄变宽,估计的精度下降
6、。二、置信区间的计算(-)正态分布总体均数的置信区间总体均数置信区间的基本公式是X±vS.。样本量较大时,可以是乂土z刃2S丘或片±z切2畋(若总体标准差已知)。实际工作中,估计总体均数置信区间时,要注意与参考值范围区别,见《卫生统计学》教材表5-4中内容。(二)二项分布总体概率的置信区间根据样本含量n和样本频率p的大小,可以采用查表法和止态近似法。重点掌握正态近似法。正态近似法:当刀足够大,且样本频率刀和(1-p)均不太小时,如"与刀(1-P)均大于5,P的抽样分布接近正态分布,此吋总体概率的置信区间为(刀-Z^Sp,p+Z血Sp缩与为门±o[案例讨论参考答案](1)根据专
7、业知识和《卫生统计学》第五章表5.3中的200名正常成年人血铅值的频数分布可知该资料属于止偏峰分布。用止态分布法X+1.64S估计止常成年人血铅值的95%参考值范围不合适,因为算术均数乂常用于描述正态资料的平均水平,而X+1.64S是以匸态曲线下面积的分布规律估计正态资料95%的观察值所在范围单侧上界。对于正偏峰分布的资料,一般用中位数M或几何均数G来描述其平均水平,并用百分位数法或将数据经对数变换后用止态分布法来估计正常成年人血铅值的95%参考值范围。本资料用百分位数法计算,得到正常成年人血铅值的95
此文档下载收益归作者所有