总体均数的估计与假设检验

总体均数的估计与假设检验

ID:19631614

大小:1.49 MB

页数:123页

时间:2018-10-04

总体均数的估计与假设检验_第1页
总体均数的估计与假设检验_第2页
总体均数的估计与假设检验_第3页
总体均数的估计与假设检验_第4页
总体均数的估计与假设检验_第5页
资源描述:

《总体均数的估计与假设检验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1第三章总体均数的估计与假设检验流行病与卫生统计学系2内容1.均数的抽样误差与标准误2.t分布(t-distribution)3.总体均数的估计4.t检验5.假设检验注意事项6.正态性检验和两样本方差比较的F检验3第一节均数的抽样误差与标准误统计推断:由样本信息推断总体特征。4样本统计指标(统计量)总体统计指标(参数)正态(分布)总体:可利用样本均数推断总体均数5例3-1若某市1999年18岁男生身高服从均数μ=167.7cm、标准差=5.3cm的正态分布。对该总体进行随机抽样,每次抽10人,(=10),共抽得

2、100个样本(=100),计算得每个样本均数及标准差6将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图9以n=60为界限10标准误:表示样本统计量抽样误差大小的统计指标均数标准误:说明均数抽样误差的大小,计算公式:(3-1)2、标准误(standarderror,SE)实质:样本均数的标准差11数理统计证明:12若用样本标准差S来估计,(3-2)降低抽样误差的途径有:①通过增加样本含量②通过设计减少S13第二节t分布(t-distribution)t分布概述抽样误差的分布规律↓样本—

3、—→总体↑t分布理论↑手段(桥梁)目的1415一、t分布的概念1617式中为自由度(degreeoffreedom,df)3.实际工作中,由于未知,用代替,则,服从t分布18二、t分布的图形与特征分布只有一个参数,即自由度19图3-3不同自由度下的t分布图201.特征:212t界值表:详见附表2,可反映t分布曲线下的面积。单侧概率或单尾概率:用表示;双侧概率或双尾概率:用表示。22-tt023举例:24第三节总体均数的估计25一、参数估计用样本统计量推断总体参数总体均数估计:用样本均数(和标准差)推断总体均数26

4、27总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围如给定=0.05,该范围称为参数的95%可信区间或置信区间如给定=0.01,该范围称为参数的99%可信区间或置信区间2.区间估计(intervalestimation):总体均数可信区间的计算需考虑:(1)总体标准差是否已知(2)样本含量n的大小通常有两类方法:(1)t分布法(2)u分布法28二、总体均数可信区间的计算291.单一总体均数的可信区间单侧1-a可信区间则为:(1)s未知:按t分布双侧1-a可信区间则为:30例3

5、-2在例3-1中抽得第15号样本得均数(cm),标准差(cm),求其总体均数的95%可信区间31323334例3-3某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。35故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47,3.81)mmolL。362.两总体均数之差的可信区间:从相等,但m不等的两个正态总体N(1,2)和N(2,2)进行随机抽样。则两总体均数之差(m1-m2)的双侧1-a

6、可信区间为3738同理,两总体均数之差(m1-m2)的单侧1-a可信区间为当两样本的样本含量均较大时(如n1和n2均大于60),可按正态分布处理39例3-4为了解氨甲喋呤(MTX)对外周血IL-2水平的影响,某医生将61名哮喘患者随机分为两组。其中对照组29例(),采用安慰剂;实验组32例(),采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10IU/ml(),标准差为7.02IU/ml();试验组治疗前IL-2的均数为16.89IU/ml(),标准差为8.46IU/ml()。问两组治

7、疗前基线的IL-2总体均数相差有多大?40第一步:411.95%的可信区间的理解:(1)所要估计的总体参数有95%的可能性在我们所估计的可信区间内(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数(3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数42三、可信区间的确切涵义2.可信区间的两个要素(1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小。当然它愈接近1愈好,如

8、99%的可信区间比95%的可信区间要好。(2)精确度:即区间的宽度区间愈窄愈好,如95%的可信区间比99%的可信区间要好。43当n确定时,上述两者互相矛盾提高准确度(可信度),则精确度降低(可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好相反,在实际应用中,95%可信区间更为常用44在可信度确定的情况下,增加样本含量可减小

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。