统计学logistic回归ppt课件.ppt

统计学logistic回归ppt课件.ppt

ID:59006814

大小:436.00 KB

页数:53页

时间:2020-09-26

统计学logistic回归ppt课件.ppt_第1页
统计学logistic回归ppt课件.ppt_第2页
统计学logistic回归ppt课件.ppt_第3页
统计学logistic回归ppt课件.ppt_第4页
统计学logistic回归ppt课件.ppt_第5页
资源描述:

《统计学logistic回归ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Logistic回归分析北京大学公共卫生学院王海俊副教授LogisticRegression什么是适宜的统计方法?1、与研究目的有关2、与资料类型有关当研究目的为建立某病发生概率与自变量关系的统计模型时,是否可用线性回归模型?为什么?P某事件发生的概率 X可能与该事件发生有关的因素 P=α+1X1+β2X2+β3X3+…+βmXm一、Logistic回归模型Logistic回归是描述一些自变量X和一个分类变量之间关系的数学模型。应变量:二分类变量,若令应变量为y,则常用y=1表示“发病”,y=0表示“不发病”(在病例对照研究中,分别表示病例组和对照组)。自变量:可以为分类变量,

2、也可以为连续变量。与线性回归分析的主要区别:应变量为连续计量资料Logistic回归的分类二分类多分类条件Logistic回归非条件Logistic回归Logistic回归模型P=P(y=1

3、x),为发病概率;0为常数项,1,2…..m分别为m个自变量的回归系数。LogisticfunctionZ=α+1X1+β2X2+β3X3+…+βmXmLogisticfunctionf(z)取值0-1,可描述/预测概率,Logistic模型是概率模型Logisticfunctionf(z)呈S-形曲线,符合流行病学对危险因素与疾病风险关系的认识Logistic回归模型特点Logit

4、变换(也称对数单位转换)logitP==P=P(y=1

5、x),为发病概率;1-P=P(y=0

6、x),为不发病概率。二、参数估计最大似然估计法(Maximumlikehoodestimate)似然函数:L=P(y=1

7、x)P(y=0

8、x)对数似然函数:lnL=∑(lnP)=lnP1+lnP2+…+lnPn非线性迭代方法——Newton-Raphson法通过迭代法估计一组参数(0,1,2…..m)使L达到最大。三、回归系数的意义单纯从数学上讲,与多元线性回归分析中回归系数的解释并无不同,亦即βi表示xi改变一个单位时,logitP的平均变化量。流行病学一些概念:设P表示暴露因

9、素X时个体发病的概率,则发病的概率P与未发病的概率1-P之比为优势或比值(odds),logitP就是odds的对数值。比值Odds=P/(1-P)比值比OR=[P1/(1-P1)]/[P0/(1-P0)]比值比OddsRatioOdds=P/(1-P)暴露组:P1=a/(a+b),1-P1=b/(a+b)Odds=a/b非暴露组:P0=c/(c+d),1-P0=d/(c+d)Odds=c/dOddsRatio(OR)患病人数未患病人数暴露组ab非暴露组cd相对危险度(relativerisk):RR=P1/P0当一种病的死亡率(或发病率)较小,近似于零时,1-P≈1,则有:OR≈

10、RR=P1/P0Logistic回归中的常数项(β0)表示,在不接触任何潜在危险/保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。Logistic回归中的回归系数(βi)表示,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即OR的对数值。Logistic回归系数的意义分析因素xi为二分类变量时,暴露xi=1,非暴露xi=0,则Logistic回归中xi的系数βi就是暴露与非暴露优势比的对数值.即,OR=exp(βi)=eβiβi=0时,OR=1,Xi对疾病不起作用;βi>0时,OR>1,Xi是疾病的危险因素;βi<0时,OR<1,Xi是疾病的保

11、护因素。分析因素xi为多分类无序变量时,为方便起见,常用1,2,…,k分别表示k个不同的类别。进行Logistic回归分析前需将该变量转换成k-1个指示变量或哑变量(design/dummyvariable),这样指示变量都是一个二分变量,每一个指示变量均有一个估计系数,即回归系数,其解释同前。分析因素xi为多分类有序(等级)变量时:如果每个等级的作用相同,可按计量资料处理:如以最小或最大等级作参考组,并按等级顺序依次取为0,1,2,…。此时,eβi表示xi增加一个等级时的优势比,e(k*βi)表示xi增加k个等级时的优势比。如果每个等级的作用不相同,则按多分类无序资料处理。分析因

12、素xi为连续性变量时,eβi表示xi增加一个计量单位时的优势比。多因素Logistic回归分析时,对回归系数的解释都是指在其它所有自变量固定的情况下的优势比。存在因素间交互作用时,Logistic回归模型中各自变量与疾病关系的联合作用为乘法模型,回归系数的解释变得更为复杂,应特别慎重。对于自变量(X1,X2),OR12=EXP(1+2)=OR1×OR2例:某研究调查胃癌发病的危险因素,得到“有不良饮食习惯”相对于“无不良饮食习惯”的OR=2.6,“喜吃卤食和盐渍食

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。