欢迎来到天天文库
浏览记录
ID:9033432
大小:5.11 MB
页数:104页
时间:2018-04-15
《多元统计-logistic回归进阶》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Logistic回归分析进阶毛振兴博士18339970522zhenxingmao@qq.com本章主要内容4.1logistic回归回顾4.3无序多分类logistic回归4.4有序多分类logistic回归4.5条件logistic回归【要求】①掌握:logistic回归参数的意义及其与OR的关系。②熟悉:logistic回归模型的基本结构;logistic回归系数的假设检验和区间估计方法;条件logistic回归与非条件logistic回归的使用条件与应用;有序多分类logistic回归和无序多分类logistic回归。③了解:logistic回归参数估计的基本思想。④
2、能根据软件输出结果整理统计报告。提出问题?•在流行病学用Mantel-Heazson分层分析方法,解决病例对照研究中的混杂因素,但当混杂因素较多时,将导致数据格子数为零,无法进一步处理?如何解决•Logistic回归分析给研究提出方向简单线性回归模型:1个X,1个Y,Y为服从正态分布的定量变量。多重线性回归模型:多个X,1个Y,Y为服从正态分布的定量变量。当Y为定性变量,X有多个时,该用什么分析方法呢?二分类变量(Y):生存与死亡、患病与未患病、有效与无效。多项无序分类变量(Y):血型,某种疾病的病理类型。等级变量(Y):疾病程度(轻度、中度、重度)、治疗效果(治
3、疗、显效、好转、无效)等。实际问题:哪些因素(X)导致了人群中有些人患某种病(Y)?哪些因素(X)导致了某种治疗方法出现治愈、显效、好转、无效等不同的效果(Y)?Logistic回归模型用途•筛选危险因素、校正混杂因素、预测与判别等。•Loisgtic回归分析既是回顾性的病例对照研究,也可以是前瞻性队列研究,还可以是横断面的现况研究。根据设计的不同,Logistic回归模型可分为:条件Logistic回归模型用于分析匹配的病例对照研究非条件Logistic回归模型用于分析成组的数据或者非匹配的病例对照研究,通常简称logistic回归根据因变量类型的不此处只能进行同,l
4、ogistic回归模非条件logistic型可分为:二分类资料多项无序分类资料有序分类资料•但在研究中,还需要考察对象到达终点所经历的时间的长短。也就是说研究者对医学事件发生、发展所经历的时间时间感兴趣。•如:恶性肿瘤、慢性病等各个观察对象随访各个时间点的发展情况,以评价临床疗效和预后的好坏。【Logistic回归模型的原理】问题实质:建立函数y=f(x)能够用来近似地描述x和y之间关系!困难:很难找到一个函数y=f(x),当x变化时,它对应的函数值y仅取两个或几个有限值。新思路:不直接分析y与x的关系,分析y取某个值的概率p与x的关系。p=p(x),使得当x变化时,它
5、对应的函数值p不超出[0,1]范围。方法:logistic回归模型。【Logistic回归模型的原理】利用一组观测数据拟合一个logistic模型,然后借助于这个模型来探讨若干个自变量与一个因变量取每个值的概率之间的关系,并评估用这一模型拟合相关事物变化规律的准确性。可以从统计意义上确定在消除了其它自变量的影响后,每一个自变量的变化是否引起因变量取某个值的概率的变化,并且估计出在其它自变量固定不变的情况下,每个自变量对因变量取某个值的概率的数值影响的大小。【Logistic回归模型的数学函数】若因变量y为连续型定量变量时,可采用多重线性回归模型分析y与变量X,X,…,X之间
6、的关系:12py=β+βX+βX+....01122现y为发病或未发病,生存与死亡等分类变量,不能直接用上模型进行分析,能否直接用发病的概率P来直接代替y呢?p=β+βX+βX+....01122Logit模型,也译作评定模型,分类评定模型,又作LogisticregressionlogitP=β+βX+βX+....01122logitP=ln[P/(1−P)]ln[P/(1−P)]=β+βX+βX+....01122Logit模型是最早的离散选择模型,也是目前应用最广的模型。Logit模型衍生发展出了其他离散选择模型,如Probit模型、NL模型(NestLogitm
7、odel)、MixedLogit模型等。ln[P/(1−P)]=β+βX+βX+....01122经数学变换可得:阳性结果发生的概率阳性结果不发生的概率eβ0+β1x1++βkxkP=1+eβ0+β1x1++βkxk1P=1+e−(β0+β1x1++βkxk)回归模型可写成:1P=1+e−(β0+β1x1++βkxk)β0表示在不接触任何潜在危险/保护因素条件下,即在自变量均为零时效应事件发生(死亡)优势(odds)的对数值,或效应指标发生与不发生的概率之比的对数值。如果暴露因素存在时,发病与不
此文档下载收益归作者所有