第05讲logistic族回归

第05讲logistic族回归

ID:21961525

大小:2.06 MB

页数:153页

时间:2018-10-21

第05讲logistic族回归_第1页
第05讲logistic族回归_第2页
第05讲logistic族回归_第3页
第05讲logistic族回归_第4页
第05讲logistic族回归_第5页
资源描述:

《第05讲logistic族回归》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、6logistic族回归content多重logistic回归模型配比设计的条件logistic回归多类结果变量的logistic回归有序结果的累积优势logistic回归有序结果的相邻优势logistic回归模型logistic回归模型的正确应用在疗效评价,发病因素研究中,应变量为分类指标有效治愈发生阳性Y无效死亡未发生阴性当自变量X为一个分类变量时—X2检验(吸烟方式与患慢性气管炎)当自变量为多个或为数值型变量时——X2检验??(分层)卡方Mantel-Haensal分析!----线性回归模型??----Y(π)进行变换,线

2、性回归模型??标准的线性回归模型:可否建立下列模型??模型右侧的取值范围为整个实数集(-∞,+∞)模型左侧π的取值范围则为0≤π≤1,0≤π≤1≠(-∞,+∞)矛盾!!解决办法:logit变换!什么是logit变换?1970年,Cox引入logit变换。把出现某种结果的概率与不出现的概率之比称为优势(或比值、比数)取其对数这就是logit变换!π→0,logit(π)→ln(0/1)→-∞π=0.5,logit(π)=ln(0.5/0.5)=0π→1,logit(π)→ln(1/0)→+∞大量实践证明,logit(π)往往和自变

3、量呈线性关系,P=?ln(x)是以e为底的x的对数。反变换:求π高等数学里exp指指数函数例:exp{F(X)}是e的F(X)次方预报事件发生(Y=1)的概率P的计算公式为:预报事件不发生(Y=0)的概率1-P的计算公式为:Logistic回归与多重线性回归模型的区别1、logistic回归模型中Y是二分类的,不是连续的;其误差的分布不是正态分布,而是二项分布,且所有的分析均建立在二项分布的基础上。2、回归系数的估计不用最小二乘法,而是最大似然法或加权最小二乘法。模型及系数的检验不是t检验和F检验,而是似然比检验、wald检验等

4、。例6.1探讨妇女使用雌激素与患子宫内膜癌的病例-对照研究资料,请计算OR及其95%可信区间,估算参数,写出回归方程,并说明回归系数与OR的关系。表6.1子宫内膜癌病例-对照研究——————————————————————————使用过未使用过合计——————————————————————————病例55(a)128(b)183对照19(c)164(d)183——————————————————————合计74293366——————————————————————————6.1.2系数的解释设P1——使用过雌激素(暴露)的调

5、查对象中病例的比例;设P0——未使用过雌激素(非暴露)的调查对象中病例的比例优势比——Logsitc回归分析:录入数据表6.2子宫内膜癌病例-对照研究资料的计算机输入格式结果变量:Y=1—病例;Y=0—对照;暴露因素:X=1—使用过雌激素;X=0—未使用过雌激素结果变量暴露因素频数f115501191012800164回归结果建立的logistic回归方程形式为:LogitP=-0.2478+1.3107x变量估计系数标准误SEzPOR95%CIx1.31070.29114.50303.70892.0964~6.5615常数项-

6、0.24780.11179-2.1010.036求优势比OR(oddsratio)当Xj的水平增加一个单位时,β>0,OR>1,表明与Xi相应的因素为危险因素(如:该因素使得患病率π升高)。注意:与变量的编码密切相关,编码不同,含义可能相反为因素Xi的Logistic回归系数,exp()为其他各因素取固定值时,因素Xi与疾病关联的优势比(OR),反映了危险因素Xi与疾病关联的程度。或称为其某两个相邻水平相比对,效应事件发生的优势比的对数值。6.1.2系数的解释Logistic回归分析中自变量的设置(1)当自变量为二分类变量时,β

7、表示X改变一个单位,logitP的改变量;系数的解释性取决于X改变一个单位的实际意义。如暴露时x=a,非暴露时x=b,lnOR=β(a-b),β不能直接解释为优势比的对数值。注意:变量进行数量化时,尽可能考虑到系数解释的方便若暴露=0,非暴露=1若暴露=1,非暴露=-1(2)当自变量为等级变量时,一般以最小等级或最大等级为参考组,按等级依次编码为0、1、2,…,SAS默认以较大赋值作为参考组(3)当自变量为连续性变量时,可不做变换,或转换为等级变量。如:年龄与患冠心病的关系。β表示每增加一岁,患病的风险是增加前的患病风险倍数。实

8、际上,常关心每5岁的变化情况,则优势比为e5β或将年龄等级化(4)当自变量为多分类变量时,常以1、2、3,…编码,应将变量转换为k-1个哑变量(或指示变量dummyvariable,designvariable);每个指示变量都是一个二分类变量,每个指示变量有一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。