logistic回归分析43916new

logistic回归分析43916new

ID:38568131

大小:1.03 MB

页数:86页

时间:2019-06-15

logistic回归分析43916new_第1页
logistic回归分析43916new_第2页
logistic回归分析43916new_第3页
logistic回归分析43916new_第4页
logistic回归分析43916new_第5页
资源描述:

《logistic回归分析43916new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十六章logistic回归分析logistic回归为概率型非线性回归模型,是研究分类观察结果(y)与一些影响因素(x)之间关系的一种多变量分析方法问题提出:医学研究中常研究某因素存在条件下某结果是否发生?以及之间的关系如何?因素(X)疾病结果(Y)x1,x2,x3…XK发生Y=1不发生Y=0例:暴露因素冠心病结果高血压史(x1):有或无有或无高血脂史(x2):有或无吸烟(x3):有或无研究问题可否用多元线性回归方法?1.多元线性回归方法要求Y的取值为计量的连续性随机变量。2.多元线性回归方程要求Y与X间关系为线性关系。3.多元线性回归结

2、果不能回答“发生与否”logistic回归方法补充多元线性回归的不足Logistic回归方法该法研究是当y取某值(如y=1)发生的概率(p)与某暴露因素(x)的关系。P(概率)的取值波动0~1范围。基本原理:用一组观察数据拟合Logistic模型,揭示若干个x与一个因变量取值的关系,反映y对x的依存关系。第一节logistic回归一、基本概念1.变量的取值logistic回归要求应变量(Y)取值为分类变量(两分类或多个分类)自变量(Xi)称为危险因素或暴露因素,可为连续变量、等级变量、分类变量。可有m个自变量X1,X2,…Xm2.两值因变

3、量的logistic回归模型方程一个自变量与Y关系的回归模型如:y:发生=1,未发生=0x:有=1,无=0,记为p(y=1/x)表示某暴露因素状态下,结果y=1的概率(P)模型。或模型描述了应变量p与x的关系P概率10.5Z值0123-1-2-3图16-1Logistic回归函数的几何图形Β为正值,x越大,结果y=1发生的可能性(p)越大。几个logistic回归模型方程logistic回归模型方程的线性表达对logistic回归模型的概率(p)做logit变换,截距(常数)回归系数Y~(-∞至+∞)线形关系方程如下:在有多个危险因素(X

4、i)时多个变量的logistic回归模型方程的线性表达:或公式16-22.模型中参数的意义Β0(常数项):暴露因素Xi=0时,个体发病概率与不发病概率之比的自然对数比值。的含义:某危险因素,暴露水平变化时,即Xi=1与Xi=0相比,发生某结果(如发病)优势比的对数值。P1(y=1/x=1)的概率P0(y=1/x=0)的概率危险因素Yx=1x=0发病=130(a)10(b)不发病=070(c)90(d)a+cb+d危险因素Yx=1x=0发病=1p1p0不发病=01-p11-p0有暴露因素人群中发病的比例反映了在其他变量固定后,X=1与x=0

5、相比发生Y事件的对数优势比。回归系数β与ORX与Y的关联β=0,OR=1,无关β>1,OR>1,有关,危险因素β<1,OR<1,有关,保护因子事件发生率很小,OR≈RR。多元回归模型的的概念二、logistic回归模型的参数估计1.模型中的参数(βi)估计通常用最大似然函数(maximumlikelihoodestimate,MLE)估计β,由统计软件包完成。(讲义259页),,2.优势比(OR)及可信区间的估计如X=1,0两分类,则OR的1-α可信区间估计公式为回归系数的标准误(公式16-10)例:讲义表16-1资料一个研究吸烟、饮酒与

6、食道癌关系的病例-对照资料(886例),试作logistic回归分析。变量的赋值经logistic回归计算后得b0=-0.9099,b1=0.8856,b2=0.5261,方程表达:控制饮酒因素后,吸烟与不吸烟相比患食管癌的优势比为2.4倍OR的可信区间估计吸烟与不吸烟患食管癌OR的95%可信区间:饮酒与不饮酒OR的95%可信区间:三、Logistic回归模型的假设检验1.检验一:对建立的整个模型做检验。说明自变量对Y的作用是否有统计意义。检验方法(讲义260-261页)1)似然比检验(likelihoodratiotest)2)Wald

7、检验3)计分检验(scoretest)例表16-1吸烟、饮酒与食管癌资料 (SAS软件计算)1.对建立的整个模型做检验。TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPr似然比68.54572<.0001计分检验67.07122<.0001Wald检验64.27842<.00012.检验二:检验模型中某β是否对Y有作用。检验假设:检验统计量:主要为Wald检验(SAS软件)例;在大样本时,三方法结果一致。公式16-13ν=1的χ2例表16-1资料,对各x的β做检验(wald检验)参数β

8、估计值标准误Chi-SquaPr常数-0.90990.135844.8699.0001吸烟0.88560.150034.8625.0001饮酒0.52610.157211.2069.0008O

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。