欢迎来到天天文库
浏览记录
ID:49410911
大小:333.00 KB
页数:36页
时间:2020-02-06
《logistic回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、logistic回归分析卫生统计学教研室陆健副教授7/17/2021表1吸烟、饮酒与食管癌关系的病例对照调查资料分层吸烟饮酒阳性例数阴性例数观察例数1否否631361992否是631071703是否44571014是是265151416表1吸烟、饮酒与食管癌关系的病例对照调查资料(收集资料的形式)调查对象序号吸烟饮酒食管癌11012000……………………875111876010分类资料的影响因素分析方法如果采用线性回归分析,应变量不满足条件,预测值会超出0和1的范围。如果采用单变量的2检验,则必然忽略其他自变量对应变量的影响。
2、如果采用Mantel-Haenszel分层分析,需要较大的样本量,而且自变量不能太多。logistic回归能较好地解决上述问题。logistic回归模型应变量Y是一个二值变量,取值为自变量X1,X2,……,Xm。P表示在m个自变量作用下事件发生的概率。logistic回归模型logistic回归模型PZlogit变换事件发生概率与未发生概率之比的自然对数,称为P的logit变换,记作logit(P)。概率P的取值范围在0~1之间,而logit(P)取值是没有界限的。logit变换回归模型中参数的意义0(常数项):所有影响因素均为
3、0时(记作X=0),个体发生事件概率与不发生事件的概率之比的自然对数值。j的含义:某因素因素Xj改变一个单位时,个体发生事件概率与不发生事件的概率之比的自然对数变化值。优势比(oddsratio,OR)优势(odds)是指某影响因素控制在某种水平时,事件发生率与事件不发生率的比值,即P/(1-P)。某影响因素的两个不同水平的优势的比值称为优势比,如某影响因素的一个水平为c1,另一个水平为c0,则这两个水平的优势比为:优势比(oddsratio,OR)OR表示影响因素对事件发生的影响方向和影响能力大小。OR>1表示该因素取值越大,
4、事件发生的概率越大,又称危险因素。OR<1表示该因素取值越大,事件发生的概率越小,又称保护因素。OR=1表示该因素与事件的发生无关。优势比(oddsratio,OR)结果吸烟不吸烟合计食管癌患者309(a)126(b)435非食管癌患者208(c)243(d)451合计517(a+c)369(b+d)886吸烟与食管癌关系的病例对照调查结果优势比(oddsratio,OR)OR与的关系=0,OR=1,影响因素与事件的发生无关。>0,OR>1,影响因素的取值越大,事件的发生的概率越大。<0,OR<1,影响因素的取值越大,事件
5、的发生的概率越小。logistic回归模型的参数估计通常采用最大似然估计(maximumlikeli-hoodestimate,MLE)估计回归系数,同时得到回归系数的标准误Sb。根据最大似然原理,在一次抽样中获得现有样本的概率应该最大。即似然函数取值最大。计算可以通过统计软件来完成。logistic回归模型的参数估计根据计算所得的bj计算OR值。OR值的可信区间:可以利用bj的抽样分布来估计,在样本含量较大的情况下,近似服从正态分布。当自变量只有两个水平时,可采用下列公式计算。logistic回归模型的参数估计以表16-1的数
6、据,计算吸烟和饮酒与食管癌关系研究的logistic回归分析中各项参数估计值。影响因素bSbOROR的95%CI常数项-0.90990.1358吸烟0.88560.15002.421.81~3.25饮酒0.52610.15721.691.24~2.30logistic回归模型的假设检验根据样本得到的logistic回归模型还需经过检验才能说明影响因素对事件发生的影响是否具有统计学意义。假设检验的假设有两种:H0:1=2=……=m(将多个影响因素作为一个整体考虑)H0:j=0(单独检验某个影响因素)logistic回归模型的
7、假设检验方法似然比检验(likelihoodratiotest):既适合单个影响因素的假设检验,又适合多个影响因素的同时检验;Wald检验(Waldtest):适合单个影响因素的检验;计分检验(scoretest):与传统Mantel-Haenszel检验结果相同,小样本时比似然比检验跟接近2分布,犯I型错误的可能性更小。似然比检验的基本思想比较包含需检验影响因素的模型和不包含该影响因素的模型,如果检验结果为拒绝H0,则表示该影响因素对回归模型有统计学意义,即对事件发生有影响。反之,则没有统计学意义,对事件发生没有影响。似然比检
8、验(例16-1)G=2(lnL1-lnL0),自由度d=p-lG1=2[lnL(X1,X2)-lnL(X2)]=35.45G2=2[lnL(X1,X2)-lnL(X1)]=11.2320.05,1=3.84,G1<20.05,1,G2<20.
此文档下载收益归作者所有