9-定性资料的统计分析1

9-定性资料的统计分析1

ID:5398092

大小:293.50 KB

页数:66页

时间:2017-11-10

9-定性资料的统计分析1_第1页
9-定性资料的统计分析1_第2页
9-定性资料的统计分析1_第3页
9-定性资料的统计分析1_第4页
9-定性资料的统计分析1_第5页
资源描述:

《9-定性资料的统计分析1》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、医学统计学定性资料的统计分析statisticalanalysisforqualitativedata主要内容二项分布简介总体率的可信区间估计Poisson分布简介总体事件数的可信区间估计样本率与总体率的比较两样本率比较的u检验四格表资料的2检验行列表资料的2检验确切概率法两事件数的比较卡方检验应用的注意事项第一节二项分布简介二项分布的基本概念在医学研究中常常碰到一些情况,其结局只有两种互相对立的结果。每个个体的观察结果只能取其中之一。毒理试验中,动物的生存与死亡;动物诱癌试验中,动物的发癌与不发癌;流行病学观察中,个体发病与不发病;在临床治疗中,病人的治愈与未愈;理

2、化检验结果的阴性与阳性等等。常用二项分布(binomialdistribution)来描述其概率分布。概率的乘法法则:几个独立事件同时发生的概率,等于各独立事件的概率之积。概率的加法法则:互不相容事件和的概率等于各事件的概率之和。例、设小白鼠接受某种毒物一定剂量时,其死亡率为=80%,则对于每只小白鼠而言,其死亡概率为=0.8,生存概率为1-=0.2。若每组各用三只小白鼠(分别计为甲、乙、丙),对每只鼠独立做实验,故各鼠的实验结果(生存或死亡)是互不影响的。观察每组小白鼠存亡情况,如果计算生与死的顺序,则共有8种排列方式;如果只计生存与死亡的数目,则只有4种组合方式

3、。三只小白鼠存亡的排列和组合方式及其概率的计算所有可能结果每种结果的概率死亡数生存数不同死亡数的概率甲、乙、丙XnX生生生0.20.20.2=0.008030.008生生死0.20.20.8=0.032生死生0.20.80.2=0.032120.096死生生0.80.20.2=0.032生死死0.20.80.8=0.128死生死0.80.20.8=0.128210.384死死生0.80.80.2=0.128死死死0.80.80.8=0.512300.5121.0001.000(0.2+0.8)3=(0.2)3+3×(0.2)2×(0.8)

4、+3×(0.2)×(0.8)2+(0.8)3三生二生一死一生二死三死为总体阳性率;n为样本例数;X为样本阳性数;CnX为从n个中抽X个的组合数,其计算公式为:式中“!”为阶乘符号,n!=1234…n,并约定0!=1。二项展开式中的各项即对应于各死亡数(X)的发生概率P(X),类似的分布即称作二项分布。从阳性率为π的总体中随机抽取含量为n的样本,恰有X例阳性的发生概率可表达为:X=0,1,2,…,n称X服从参数为n和的二项分布,记为:X~B(n,)。其中参数n由实验者确定,而总体率常常是未知的。例、已知n=3,=0.8,则恰有1例阳性的概率P(1)为:二

5、项分布的均数与标准差若X~B(n,),则阳性数X的总体均数及其标准差为:若均数与标准差不用绝对数X而用率p表示时,即对以上两式分别除以n:样本率的标准差又称为率的标准误。二项分布的累计概率常用的有左侧累计和右侧累计两种方法。从阳性率为的总体中随机抽取n个个体,则:1、最多有k例阳性的概率:2、最少有k例阳性的概率:例1、据以往经验,用某药治疗小儿上呼吸道感染、支气管炎,有效率为85%,今有5个患者用该药治疗,问:①至少3人有效的概率为多少?②最多1人有效的概率为多少?本例=0.85,1-=0.15,n=5,依题意,①至少3人有效的概率:P(X≥3)=P(3)+

6、P(4)+P(5)=0.138178125+0.391504688+0.443705313=0.973388126②最多1人有效的概率为:P(X≤1)例2、经统计,某省用“中药阑尾炎合剂”治疗急性阑尾炎性腹膜炎的有效率为86%,试分别估计:①治疗10例中至少9例有效的概率;②治疗10例中至多7例有效的概率。本例=0.86,1-=0.14,n=10,依题意,①治疗10例中至少9例有效的概率:②治疗10例中至多7例有效的概率:二项分布的图形在实际应用中,n足够大,且不太大也不太小,即既不接近于0也不接近于1时,常可用正态近似原理处理二项分布的问题。一般判断标准:n和n

7、(1-)均大于5。二项分布的应用条件二分类资料,即各观察单位只能有互相对立的两种结果之一。两种对立结果发生的概率合计为1。观察结果相互独立,如疾病无传染性、无家族聚集性。第二节率的可信区间估计与定量资料的均数一样,二项分布资料的样本率同样存在抽样误差。样本率的标准差又称为率的标准误为:一、总体率的可信区间估计(一)正态近似法当n较大、且p不太大也不太小时(常可通过np与n(1-p)均大于5来判断),样本率p的抽样分布近似服从正态分布。可利用正态分布原理来估计总体率的可信区间。可信度为1-α的可信区间为:(p-uSp,p+

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。