医学统计学之总体均数的估计与假设检验

医学统计学之总体均数的估计与假设检验

ID:43475406

大小:378.00 KB

页数:100页

时间:2019-10-08

医学统计学之总体均数的估计与假设检验_第1页
医学统计学之总体均数的估计与假设检验_第2页
医学统计学之总体均数的估计与假设检验_第3页
医学统计学之总体均数的估计与假设检验_第4页
医学统计学之总体均数的估计与假设检验_第5页
资源描述:

《医学统计学之总体均数的估计与假设检验》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第三章 总体均数的估计 与假设检验第一节均数的抽样误差与标准误了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。对无限总体不可能对所有个体逐一观察,对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究。借助抽样研究。欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。由个体变异和抽样造成的样本统计量与总体参数的差异,称为抽样误

2、差。这些来自同一总体的若干样本统计量间,也存在抽样误差。在抽样研究中,抽样误差是不可避免的。由于其产生的根本原因是生物个体的变异性,故抽样误差分布具有一定的规律性。例3-1某市1999年18岁男生身高服从=167.7cm、=5.3cm正态分布,从该N(167.7,5.32)总体中随机抽样(图3-1)。每次=10人,共有样本g=100个,得到每个样本均数及标准差。将上述100个样本均数看成新变量值,这100个样本均数构成一新分布。样本均数抽样分布具有如下特点:①各样本均数未必等于总体均数;②各样本均

3、数间存在差异(表3-1);③样本均数围绕总体均数(167.7cm)呈正态分布(图3-2);④样本均数变异范围较原变量变异范围大大缩小,这100个样本均数的均数为167.69cm、标准差为1.69cm。在非正态分布总体中可进行类似抽样。可得到如下结论:若服从正态分布则服从正态分布若不服从正态分布n大:则近似服从正态分布n小:则为非正态分布的总体均数为;而的标准差比原个体值的标准差要小,为区别两者,的标准差用表示。样本统计量的标准差称标准误(standarderror,SE)。样本均数的标准差称均数的标

4、准误(standarderrorofmean,SEM),反映样本均数间离散程度。可证明均数标准误在实际工作中常未知,用S来估计。均数标准误估计值均数标准误大小与标准差大小成正比,与样本含量n的平方根成反比。第二节t分布一、t分布的概念若某一随机变量X服从总体均数为、总体标准差为的正态分布N(,2)由于样本均数服从总体均数为、总体标准差为的正态分布N(,)=2n为计算某一统计量用到的数据个数,m为计算该统计量用到其它独立统计量的个数。t分布最早由英国统计学家W.S.Gosset于1908

5、年以“Student”笔名发表,故又称Student'st-distribution。它的发现,开创了小样本统计推断的新纪元。二、t分布的图形与特征t分布是一簇曲线。不同,曲线形状不同(图3-3)。①单峰分布,以0为中心,左右对称②越小,t值越分散,t分布的峰部越矮而尾部翘得越高;③当逼近,逼近,t分布逼近u分布。t分布曲线下面积(概率P或)与横轴t值间的关系(附表2):在t界值表中,一侧尾部面积称单侧概率,两侧尾部面积之和称双侧概率。在相同自由度时,值增大,P减小;在相同值时,双尾P为单尾

6、P的两倍。如双尾=单尾=1.812。第三节总体均数的估计一、可信区间的概念参数估计是用样本统计量推断总体参数。有点估计和区间估计两种。点估计是用相应样本统计量直接作为其总体参数的估计值。如用估计、S估计等。其方法虽简单,但未考虑抽样误差的大小。区间估计是按预先给定的概率(1)所确定的包含未知总体参数的一个范围。该范围称为参数的可信区间或置信区间(confidenceinterval,CI);预先给定的概率(1)称为可信度或置信度(confidencelevel),常取95%或99%。可信区

7、间通常由两个数值即可信限/置信限(confidencelimit,CL)构成。其中较小的值称可信下限(lowerlimit,L),较大的值称可信上限(upperlimit,U),一般表示为LU。二、总体均数可信区间的计算1.单一总体均数的可信区间(1)未知:按t分布。(2)已知或未知但n足够大(如n>60)时:按u分布。2.两总体均数之差的可信区间1.单一总体均数的可信区间(1)未知:双侧1–α可信区间单侧1–α可信区间例3-2在例3-1中抽得第15号样本的=166.95(cm),S=3.6

8、4(cm),求其总体均数的95%可信区间。(cm)故该地18岁男生身高均数的95%可信区间为(164.35,169.55)cm。(2)已知或未知但n足够大:已知:双侧1–α可信区间单侧1–α可信区未知但n足够大:双侧1–α可信区间单侧1–α可信区例3-3某地抽取正常成年人200名,测得其血清胆固醇均数为3.64mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。本例=3.64、S=1.20、n=200、=0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。