欢迎来到天天文库
浏览记录
ID:48738256
大小:307.00 KB
页数:37页
时间:2020-01-21
《logistic回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、Logistic回归分析LogisticRegressionAnalysis翟景花公共卫生学院复习:线性回归分析对反应变量的要求反应变量y连续型服从正态分布舒张压年龄胆固醇含量自变量x数值型与Y呈线性关系例如:2医学研究中经常遇到分类型变量,例如:二分类变量:生存与死亡有病与无病有效与无效感染与未感染多分类有序变量:疾病程度(轻度、中度、重度)治愈效果(治愈、显效、好转、无效)多分类无序变量:手术方法(A、B、C)就诊医院(甲、乙、丙、丁)3医学研究者经常关心的问题诸如:吸烟是否影响肺癌的发病?年龄和糖尿病的发病有无关系?哪些因
2、素导致了手术后有的人感染,而有的人不感染?哪些因素导致了某种治疗方法出现治愈、显效、好转、无效等不同的效果?是回归分析问题吗?4这些应该是属于回归分析问题!但是这种回归分析问题不能借助于线性回归模型,因为反应变量的假设条件遭到破坏能否找到一种其他形式的模型y=f(x)来描述分类变量y和x之间依存关系呢?NO因为从数学角度看,使得x取任意值而y仅取1和0两个值的函数不存在。YES!5“转换一个角度来解决这个问题”y=f(x)p=p(y=1
3、x)=p(x)不能直接分析变量y与x的关系转换为分析y取某个值的概率变量p与x的关系y=1,
4、0x任意0≤p≤1,x任意存在Logistic回归模型不存在6主要内容Logistic回归模型的基本概念Logistic回归的参数估计及假设检验Logistic回归分析的分类Logistic回归的应用7第一节Logistic回归模型的基本概念一、Logistic回归的实例8二、Logistic回归模型的基本结构AMI抢救后死亡率与影响因素关系的回归模型P值大于1或小于0变量变换91970年,Cox引入了Logit变换请注意其右侧仍然可以写成线性的形式!大量实践证明,LogitP往往和自变量呈线性关系。已经成为了分类变量的标准建模
5、方法。Logistic函数Logistic回归模型10多变量的Logistic回归模型11Logistic回归概念是分类数据统计分析的一种重要方法,研究多水平(包括2个水平)的应变量与其影响因子间关系的回归分析。即用于分析某类事件发生概率与自变量之间依存关系的回归,即Logistic回归。Logistic这个名称来源于它所采用的Logit变换,和英文单词Logistic的含义(后勤的)一点关系都没有,与逻辑就更不相干了。自从传入国内以来,Logistic回归就一直采用英文写法,从没有使用过译名。12第二节Logistic回归的参
6、数估计及假设检验引发的新特点由于反应变量为二分类,所以误差项应当服从二项分布,而不是正态分布。误差项的分布规律应当和所预测的反应变量相同由于上述原因,最小二乘法也不再适用,最大似然法的优越性和重要性一举凸现出来。13最大似然法(maximumlikelihood,ML)的基本思想是先建立似然函数或对数似然函数,求似然函数或对数似然函数达到极大时参数的取值,称为参数的最大似然估计值。计算方法来自于概率分布。似然(L,likelihood):某种结局组合出现的概率,由于总体率不同L也不同,所以又被称为似然函数。一、Logistic回
7、归的参数估计及意义1415常数项表示在自变量取值均为0时,死亡优势(比数)的自然对数值。exp()=0.124是无休克、无心衰和抢救及时组死亡的优势。当死亡率很低时,该值近似等于自然死亡率。16β为Logistic回归系数,表示其它自变量取值固定时,该自变量增加一个单位引起优势比自然对数的变化量。β=lnOR,OR=eβ或OR=exp(β)OR表示暴露组的疾病危险是非暴露组的多少倍。OR>1为危险因素;OR<1为保护因素。17logistic回归模型系数β的意义解释:从e=OR≈RR,说明当发病率很低时,e近似地表示了相对危
8、险度,即暴露下的发病率与非暴露下的发病率之比。例如,在例20-1中得到1=1.110,因此,RR≈OR=e=3.034,表明心梗发生后抢救前有休克的死亡危险是没有休克的3.034倍。18一般地,logistic回归模型系数的意义是:2)如果X是连续变量,则OR近似表示在X相邻两个单位上的相对危险度。1)如果X=1、0,则OR近似表示在X=1条件下的发病率与X=0条件下发病率之比。(见例20-1)3)如果X是分类变量,则要将X的哑变量放入模型,则OR表示两个类之间的相对危险度。19二、假设检验和回归系数的区间估计1.似然比检验
9、(likelihoodratiotest)⑴检验整个模型是否有统计学意义,即检验所有的偏回归系数是否均为0。检验假设为H0:β1=…=βm=0H1:β1,…,βm不全为0统计量G=-[2lnL(-1,…,-m)]--2lnL’其中L是不包含m个自变量的模型的似然
此文档下载收益归作者所有