Logistic回归分析1

Logistic回归分析1

ID:38567552

大小:724.00 KB

页数:68页

时间:2019-06-15

Logistic回归分析1_第1页
Logistic回归分析1_第2页
Logistic回归分析1_第3页
Logistic回归分析1_第4页
Logistic回归分析1_第5页
资源描述:

《Logistic回归分析1》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Logistic回归分析汕大医学院预防医学教研室Logisticregression:是研究分类变量统计分析的一种重要方法。研究两水平或多水平反应变量与其影响因子间关系的回归分析(线性回归分析:应变量为连续计量资料)。Logistic回归模型是一种概率模型,通常以疾病,死亡等结果发生的概率为因变量,影响疾病发生的因素为自变量建立回归模型。第一节Logistic回归目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。资料:1.应变量为反映某现象发生与不发生的二值变量或多分类变量;2.自变量宜全部或大部分为分类

2、变量,可有少数数值变量。分类变量要数量化。医学研究中常碰到应变量的可能取值仅有两个(即二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,也有多分类的应变量,如疗效分级,血压等级等。试验者术前检查了53例前列腺癌患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X-RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果变量NODES(1、0分别表示癌症的淋巴结转移与未转移)建立淋巴结转移的预报模型。实例53例接受手术的前列腺癌患者情况26例冠心病病

3、人和28例对照者进行病例对照研究26例冠心病病人和28例对照者进行病例对照研究Logistic回归的分类Logistic回归二分类多分类非条件:成组资料1:1配对资料条件Logistic回归1:m配对资料m:n配对资料根据研究设计不同要求:(1)各观察对象的独立性(2)所需样本量大小与自变量的个数一、Logistic回归方程Logistic回归的logit模型(1)取值问题(2)曲线关联反应变量与自变量的关系通常不是直线关系,而是S型曲线。曲线回归时,往往采用变量变换,使得曲线直线化,再进行直线回归方程的拟合。能否考虑对所预测的因变量加以变换。1970年,

4、COX引入了用于人口学领域的Logit变换。概率P是以0.5为对称点,分布在0~1的范围内的,而相应的Logit(P)的大小为P=0Logit(P)=Ln(0/1)=-无穷大P=0.5Logit(P)=Ln(0.5/0.5)=0P=1Logit(P)=Ln(1/0)=+无穷大Logit(P)取值范围扩展为(-,+-)Z-5-4-3-2-10123450.2.4.6.81PLogit变换也称对数单位转换logitP=常数项表示暴露剂量为0时个体发病与不发病概率之比的自然对数。回归系数表示自变量改变一个单位时logitP的改变量。其中,为常数项,为偏回归系

5、数。比数(优势)Odds=P/(1-P)优势比(比值比)OR(oddsratio)设P表示暴露因素X时个体发病的概率,则发病的概率P与未发病的概率1-P之比为优势(odds),logitP就是odds的对数值。两个比值之比称为比值比(OddsRatio),简称OR。参数解释回归系数的解释建立Logistic回归方程就是求和i意义:常数项是当各种暴露因素为0时,个体发病与不发病概率之比的自然对数值。i意义偏回归系数,表示在其它自变量固定的条件下,第i个自变量每改变一个单位时logit的改变量。它与比数比(优势比)(oddsratio)有对应关系。是对自变

6、量Xi作用大小的一种度量。Logistic回归中的常数项(b0)表示,在不接触任何潜在危险/保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。Logistic回归中的回归系数(bi)表示,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即OR的对数值。Logistic回归系数的意义分析因素xi为二分类变量时,存在(暴露)xi=1,不存在(未暴露)xi=0,则Logistic回归中xi的系数bi就是暴露与非暴露优势比的对数值。即OR=exp(bi)=e(bi)哑变量自变量为多分类变量,与应变量之间通常不存在线性关系,须用哑变量方

7、式分析。若K为该变量的水平数,则系统将自动产生K-1个哑变量。Categorical子对话框用于此设置。多分类无序自变量多分类有序自变量,要求其等级分组与LogitP呈线性关系,如不满足条件,则将等级变量当作无序变量,用哑变量进行分析。实际是依次将反应变量按不同的取值水平分割呈两个等级,对这两个等级建立反应变量为二分类的Logistic回归模型。常数项改变了,偏回归系数不变。OR值是自变量每改变一个单位,反应变量提高一个及一个以上等级的比数比。SPSS中Categorical按钮实现Indicator:指标对比,参照水平注意:有实际意义;参照水平有一定频数保证

8、。为了便于解释,对二项分类变量一般按0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。