欢迎来到天天文库
浏览记录
ID:38567557
大小:336.31 KB
页数:21页
时间:2019-06-15
《Logistic回归分析(童新元》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、LogisticRegressionAnalysisLogistic回归分析童新元中国人民解放军总医院2004年10月18日Logistic回归分析在医学研究中,经常要分析某种结果的产生与哪些因素有关。例如:生存与死亡,发病与未发病,阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、体质、遗传等许多因素有关。如何找出其中哪些因素对结果的产生有显著性影响呢?Logistic回归分析能较好地解决这类问题。一、Logistic回归模型1、Logistic回归模型的构造若因变量y为连续型正态定量变量时,可采用多元线性回归分析y与变量X1,X2,…,Xp之间的关系:y=
2、β0+β1X1+β2X2+…+βpXp现y为发病或未发病,生存与死亡等定性分类变量,不能直接用上模型进行分析。能否用发病的概率P来直接代替y呢?p=β0+β1X1+β2X2+…+βpXp等式左边变化范围P发病概率0≤P≤11-P不发病概率0≤P≤1p/1-p比数(ratio)0≤p/1-p<+∞ln(p/1-p)对数比(ratio)-∞3、1X1+…+βpXp;经数学变换可得:exp(β0+β1X1+…+βpXp)P=─────────────1+exp(β0+β1X1+…+βpXp);exp表示指数函数。Logistic回归模型是一种概率模型,它是以疾病,死亡等结果发生的概率为因变量,影响疾病发生的因素为自变量建立回归模型。它特别适用于因变量为二项,多项分类的资料。在临床医学中多用于鉴别诊断,评价治疗措施的好坏及分析与疾病预后有关的因素等。CHISS软件要求,对分类变量Y数量化,而且赋值为:1发病(阳性,死亡,治愈等)y=0未发病(阴性,生存,未治愈等).注意:P=P(y=1),即发病的概率。3、软件4、的要求4、回归系数βi的意义设只有一个自变量X,Logistic方程为lnP/(1-P)=β0+β1xX=0表示非暴露,1表示暴露。X=1时的发病概率为P1;X=0时的发病概率为P0。P1/(1-P1)则,OR=──────P0/(1-P0)ln(OR)=logit[P(1)]-logit[P(0)]=(β0+β1×1)-(β0+β1×0)=β1logistic回归系数的意义β表示自变量每增加一个单位,其优势比的对数值的改变量,OR=eβlnOR=β亦即自变量每增加一个单位,其相对危险度为eβ。例如,吸烟与肺癌的关系的研究令1吸烟1肺癌X=y=0不吸0非肺癌若求得:β5、=1,OR=e意思是:吸烟的人得肺癌症的危险性是不吸烟的2.71828倍。注意变量X的赋值与OR的关系令0吸X=1不吸则求得β=?OR=?则求得:β=-1,OR=1/e意思是:不吸烟的人得肺癌症的危险性是吸烟的36.79%。二、logistic回归的作用(1)建立logistic回归模型:logit(p)=β0+β1X1+β2X2+…+βpXp;(2)预测预报若已知x1,x2…xm数值大小时,通过模型可以预测发病、死亡等的概率;(3)因素分析寻找发病、死亡等影响有显著性的因素。设研究问题中含有p个指标变量x1,x2,…,xp及Y.n个观察对象.其数据结构为:编号X1X6、2….XPy1x11x21…x1py12x21x22…x2py2………………nxn1xn2…xnpyp━━━━━━━━━━━━━━━━Y的值要求数值化。Y=1为发病。三、数据结构四、Logistic分析的具体任务:1)采用极大似然估计或加权最小二乘估计确定方程中系数βi=0,1,2,3…;2)采用(剩余)卡方检验对回归方程进行检验;3)采用U检验对方程中的每个系数bi进行显著性检验。五、CHISS的实现点击模型→数学模型→logistic模型六、实例讲解例11-1某研究者调查了15名正常病人和15名肺癌患者,记录了同肺癌发病有关的危险因素情况,数据如下表。试分析各因素7、与肺癌间的关系。七、Logistic回归方程的应用-----------预测与估计求出logistic回归方程后,可求出每个观测点发病概率。谢谢
3、1X1+…+βpXp;经数学变换可得:exp(β0+β1X1+…+βpXp)P=─────────────1+exp(β0+β1X1+…+βpXp);exp表示指数函数。Logistic回归模型是一种概率模型,它是以疾病,死亡等结果发生的概率为因变量,影响疾病发生的因素为自变量建立回归模型。它特别适用于因变量为二项,多项分类的资料。在临床医学中多用于鉴别诊断,评价治疗措施的好坏及分析与疾病预后有关的因素等。CHISS软件要求,对分类变量Y数量化,而且赋值为:1发病(阳性,死亡,治愈等)y=0未发病(阴性,生存,未治愈等).注意:P=P(y=1),即发病的概率。3、软件
4、的要求4、回归系数βi的意义设只有一个自变量X,Logistic方程为lnP/(1-P)=β0+β1xX=0表示非暴露,1表示暴露。X=1时的发病概率为P1;X=0时的发病概率为P0。P1/(1-P1)则,OR=──────P0/(1-P0)ln(OR)=logit[P(1)]-logit[P(0)]=(β0+β1×1)-(β0+β1×0)=β1logistic回归系数的意义β表示自变量每增加一个单位,其优势比的对数值的改变量,OR=eβlnOR=β亦即自变量每增加一个单位,其相对危险度为eβ。例如,吸烟与肺癌的关系的研究令1吸烟1肺癌X=y=0不吸0非肺癌若求得:β
5、=1,OR=e意思是:吸烟的人得肺癌症的危险性是不吸烟的2.71828倍。注意变量X的赋值与OR的关系令0吸X=1不吸则求得β=?OR=?则求得:β=-1,OR=1/e意思是:不吸烟的人得肺癌症的危险性是吸烟的36.79%。二、logistic回归的作用(1)建立logistic回归模型:logit(p)=β0+β1X1+β2X2+…+βpXp;(2)预测预报若已知x1,x2…xm数值大小时,通过模型可以预测发病、死亡等的概率;(3)因素分析寻找发病、死亡等影响有显著性的因素。设研究问题中含有p个指标变量x1,x2,…,xp及Y.n个观察对象.其数据结构为:编号X1X
6、2….XPy1x11x21…x1py12x21x22…x2py2………………nxn1xn2…xnpyp━━━━━━━━━━━━━━━━Y的值要求数值化。Y=1为发病。三、数据结构四、Logistic分析的具体任务:1)采用极大似然估计或加权最小二乘估计确定方程中系数βi=0,1,2,3…;2)采用(剩余)卡方检验对回归方程进行检验;3)采用U检验对方程中的每个系数bi进行显著性检验。五、CHISS的实现点击模型→数学模型→logistic模型六、实例讲解例11-1某研究者调查了15名正常病人和15名肺癌患者,记录了同肺癌发病有关的危险因素情况,数据如下表。试分析各因素
7、与肺癌间的关系。七、Logistic回归方程的应用-----------预测与估计求出logistic回归方程后,可求出每个观测点发病概率。谢谢
此文档下载收益归作者所有