抽样误差与假设检验

抽样误差与假设检验

ID:27661531

大小:509.34 KB

页数:23页

时间:2018-12-05

抽样误差与假设检验_第1页
抽样误差与假设检验_第2页
抽样误差与假设检验_第3页
抽样误差与假设检验_第4页
抽样误差与假设检验_第5页
资源描述:

《抽样误差与假设检验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章抽样误差与假设检验(SamplingErrorandHypothesisTest)哈尔滨医科大学李康第一节均数的抽样误差与标准误一、均数的抽样误差在医学研究中,绝大多数情况是由样本信息研究总体。由于个体存在差异,因此通过样本推论总体时会存在一定的误差,如样本均数往往不等于总体均数,这种由抽样造成的样本均数与总体均数的差异称为抽样误差。对于抽样研究,抽样误差不可避免。二、抽样误差的分布理论上可以证明:若从正态总体中,反复多次随机抽取样本含量固定为n的样本,那么这些样本均数也服从正态分布,即的总体均数仍为,样本均数的标准差为。抽样分布抽样分布示意图中心极限定理:当

2、样本含量很大的情况下,无论原始测量变量服从什么分布,的抽样分布均近似正态。抽样分布抽样分布示意图三、标准误(StandardError)样本均数的标准差称为标准误。样本均数的变异越小说明估计越精确,因此可以用标准误表示抽样误差的大小:实际中总体标准差往往未知,故只能求得样本均数标准误的估计值:例4.1在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38×1012/L,试计算均数的标准误。标准误是抽样分布的重要特征之一,可用于衡量抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。第二节总体均数的估计一、可信

3、区间的概念(ConfidenceInterval)区间估计:指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率称为可信度,通常取。参数估计点估计:不考虑抽样误差,如区间估计:考虑抽样误差二、可信区间的计算(一)已知一般情况其中为标准正态分布的双侧界值。可信区间:标准正态分布(二)未知通常未知,这时可以用其估计量S代替,但已不再服从标准正态分布,而是服从著名的t分布。图4-2不同自由度的t分布图可信区间的计算:计算可信区间的原理与前完全相同,仅仅是两侧概率的界值有些差别。即可信区间:需要注意:在小样本情况下,应用这一公式的条件是原始变量服从

4、正态分布。在大样本情况下(如n>100),也可以用替换近似计算。例4.2某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L,标准差为0.57g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。下限:上限:例4.3试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。本例属于大样本,可采用正态近似的方法计算可信区间。因为,则95%可信区间为:下限:上限:三、模拟实验模拟抽样成年男子红细胞数。设定:产生100个随机样本,分别计算其95%的可信区间,结果用图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数,只有6个可信区间

5、没有包含总体参数(用星号标记)。图4-2模拟抽样成年男子红细胞数100次的95%可信区间示意图******第三节假设检验的意义和步骤(HypothesisTest)统计推断的另一个重要内容,目的是通过样本数据比较总体参数之间有无差别。一、假设检验的基本思想例4.4使用黑加仑油软胶囊治疗高脂血症,30名高脂血症患者治疗前后血清甘油三酯检测结果的差值为1.38±0.76(g/L),问治疗后血清甘油三酯是否有所改善?样本治疗前后甘油三酯的变化(差值)问题归纳:样本疗效药物作用+机遇对上面问题可以作如下考虑:问题:究竟多大能够下“有效”的结论?假定治疗前后血清甘油三酯检测结

6、果的差值服从正态分布,若则服从t分布。根据t分布能够计算出有如此大差异的概率P,如果P值很小,即计算出的t值超出了给定的界限,则倾向于拒绝H0,认为治疗前后有差别。图4-3利用t分布进行假设检验原理示意图二、假设检验的基本步骤1.建立假设和确定检验水准无效假设H0(nullhypothesis)指需要检验的假设,备择假设H1(alternativehypothesis)指在H0成立证据不足的情况下而被接受的假设。例如建立治疗前后血清甘油三酯疗效的无效假设和备择假设分别为检验水准是预先规定的拒绝域的概率值,实际中一般取。[说明]:备择假设有双侧和单侧两种情况。双侧检验

7、指不论正方向还是负方向的误差,若显著地超出检验水准则拒绝H0,即为双侧检验;单侧检验指仅在出现正方向或负方向误差超出规定的水准时则拒绝H0,如治疗后血清甘油三酯下降的假设可表示为双侧检验和单侧检验应如何选择,需根据研究目的和专业知识而定。一般情况下,双侧检验更为稳妥,因为对相同的样本,双侧检验得出有显著性差别的结论,单侧检验也一定是显著的。2.选择检验方法和计算检验统计量根据资料类型、研究设计方案和统计推断的目的,选择适当的检验方法,不同检验方法各有其相应的检验统计量及计算公式。许多假设检验方法是以检验统计量来命名的,如t检验、u检验、F检验和检验等。3.确定P

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。