分类变量的统计推断

分类变量的统计推断

ID:41589107

大小:1.14 MB

页数:58页

时间:2019-08-28

分类变量的统计推断_第1页
分类变量的统计推断_第2页
分类变量的统计推断_第3页
分类变量的统计推断_第4页
分类变量的统计推断_第5页
资源描述:

《分类变量的统计推断》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1第五章分类变量资料的统计推断教学要求掌握率的抽样误差计算公式掌握四格表χ²检验3第一节率的抽样误差一、二项分布的概念例:假设注射某种免疫疫苗会有10%的人出现不适反应。问3人接种后各种可能后果的概率是多少?45贝努利试验:n次独立、重复试验(每次试验只出现A和之一,每次概率都是和)。贝努利试验中,事件A可能发生0,1,2,…,n次,A恰好发生k次的概率为6若随机变量X只能在中取值,各种可能值的概率满足前式,我们就说X服从参数为n和π的二项分布,记为7已知:①π=0.5,n=10;②π=0.3,n=5;③π=0.3,n=10;④π=0.3,n=15。根据上式,求各阳性数事件的概率并作概率分布图

2、。8率的抽样分布特征:1.为离散型分布;2.当π=1-π时,呈对称分布;3.当n增大时,逐渐逼近正态分布。一般认为,当nπ和n(1-π)≥5时,可近似看作正态分布。9二、率的抽样误差和标准误由于抽样所引起的样本率和总体率或各样本率之间存在着差异,这种差异称为率的抽样误差。用率的标准误表示。10例:为了解某地人群结核菌素试验阳性率情况,某医疗机构在该地人群中随机检测了1773人,结核菌素试验阳性有682人,试计算其标准误。11第二节总体率的估计总体率的估计:点估计区间估计正态近似法12当样本含量n足够大,样本率p或1-p均不太小时(如np和n(1-p)均大于5),样本率的分布近似正态分布。139

3、5%的置信区间:38.47%1.961.16%=36.20%~40.74%99%的置信区间:38.47%2.581.16%=35.48%~41.46%上例中该地人群中结核菌素试验阳性率95%和99%的置信区间为:14第三节率的U检验当样本含量n足够大,样本率p或1-p均不太小时,如np和n(1-p)均大于5,样本率的分布近似正态分布。样本率和总体率之间、两个样本率之间的比较可用Z检验。15一、样本率与总体率的比较16例:一般情况下,直肠癌围术期并发症发生率为30%,现某医院手术治疗了385例直肠癌患者,围术期出现并发症有100例,并发症发生率为26%,问该院直肠癌患者围术期并发症发生率

4、与一般情况比较有无统计学差异。分析:本例,n=385,属于大样本,同时样本率为26%,np和n(1-p)均大于5,可采用Z检验。17建立检验假设H0:=0,H1:0,=0.052.计算Z值3.确定P值,判断结果本题Z=1.713<1.96,P>0.05,按=0.05的水准不拒绝H0,差异没有统计学意义,故尚不能认为该院直肠癌患者围术期并发症发生率与一般情况不同。18二、两个样本率的比较19例:为了解某地小学生蛔虫感染率的城乡差异,抽样调查了该地小学生22792人,其中城镇小学生8207人,粪检蛔虫卵阳性数为701人,蛔虫感染率为8.54%,乡村小学生14585人,粪检蛔虫卵阳性数

5、为2167人,蛔虫感染率为14.86%,试比较该地小学生蛔虫感染率城乡差异有无统计学意义。20本题=13.739>2.58,P<0.01,按=0.05的水准拒绝H0,接受H1,差异有统计学意义,认为该地乡村小学生蛔虫感染率高于城镇。3.确定P值,判断结果建立检验假设H0:1=2,H1:12,=0.052.计算Z值不同自由度的分布曲线图自由度一定时,P值越小,χ²界值越大P值一定时,自由度越大,χ²界值越大当自由度为1时,χ²=u²例:某医院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。问两组降低颅内压的总体有效率有无差别?第二节卡方检验一、四格表资料

6、卡方检验200例颅内压增高症患者随机分为两组1试验组有效2试验组无效3对照组无效……200试验组有效组别有效无效试验组对照组两组降低颅内压疗效的比较两种可能性:两组总体有效率确实不同两组总体有效率相同,两组样本率的差异仅仅是由于抽样误差造成。9957521合计10496有效率(%)95.2078.131、建立检验假设,确定检验水准,两组降低颅内压总体有效率相等,两组降低颅内压总体有效率不等(83.52)(理论频数T12?)(90.48)实际频数A(13.52)(理论频数T22?)(理论频数T21?)(理论频数T11?)组别有效无效合计有效率(%)试验组99510495.20对照组7521967

7、8.13合计表7-1两组降低颅内压有效率的比较17487.0020026(12.48)理论频数是在成立的前提下计算的A:实际频数(Actualfrequency)T:理论频数(Theoreticalfrequency)英国统计学家KarlPearson首次提出,故被称为Pearson。2、求检验统计量和自由度99(90.48)5(13.52)75(83.52)21(12.48)3、查表,求值,下结

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。