欢迎来到天天文库
浏览记录
ID:11685019
大小:20.39 KB
页数:8页
时间:2018-07-13
《logistic回归分析的判别预测功能及其应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Logistic回归分析的判别预测功能及其应用【摘要】 目的:介绍Logistic回归模型在判别分析中的应用。方法:结合实例介绍Logistic回归的判别功能的思想、原理、条件和步骤及其在医学领域的应用前景。结果:Logistic回归应用于判别分析时,显示出了较高的准确性和较好的预测效果。结论:Logistic回归在定性和半定量资料的判别和预测方面有一定的优势,结合计算机网络技术的发展在医学领域有较好的应用前景。【关键词】 Logis戤tic回归;判别分析;预测;医学应用毛Logistic回归分析在医学研究淄中应用广泛。目前主要是用于流行病学研究中危险因素
2、的筛选,但它同时具有良好的判别和预测功能,尤其是在资料类型不署能满足Fisher判别和Bayes判渝别的条件时,更显示出Logistic量回归判别的优势和效能。本研究对Log脚istic回归方程的判别分析进行了探睁讨,并用一实例介绍其应用。1 多元琉Logistic回归模型介绍在多元哥线性回归模型中,因变量y的取值范围是,具体取值取决于自变量的取值范围,而霆在疾病的危险度分析中,因变量是二分类变量,又称0-1变量,如发病与不发病肢8/8。用率P作为因变量,则P的取值范围为孝,此时要用自变量的线性组合进行变量的畦筛选、作用大小的比较和自变量交互作用的研
3、究,就必须通过一个函数关系将因变懑量P和自变量的线性组合联系起来,这个ヰ函数关系便是Logit变换,具体如下茌:设P为暴露因素为x时个体发病的概嫜率,则发病的概率P与未发病的概率1-P之比称为优势比,LogitP定义为笋优势比的对数:LogitP=ln(p隳1-p),此时LogitP的取值范围濯为,多元Logistic回归模型定义せ为:LogitP=α+β1x1+β2藤x2+…+βmxm (1)将Log潜itP看成因变量,Logistic回条归就与多元线性回归的形式是一样的[1蚱,2]。2 Logistic回归的斫判别预测功能及用法在Bayes判别惦分析中
4、,其后验概率的计算公式为:P(ⅣD=1
5、x)=exp(β0+β1x1+…+βpxp)1+exp(β0+βㄠ1x1+…+βpxp)(2)此公式で和Logistic模型的表达式是完全摆相同的,其区别在于Bayes判别分析殒是在各类内指标服从多元正态分布的前提下用判别函数法估计参数,并且需要知道先验概率,而Logistic回归估计参数却没有这一要求。它是直接根据指标纷情况通过回归模型求出某一事件发生的估π8/8计概率。因此,Logistic回归不テ仅具有判别和预测功能,而且限制条件少,资料要求相对低,适用于定性的或半定廉量的指标,估计各种自变量组合条件下
6、应啐变量各级别的发生概率,在临床判别诊断ξ和危险人群筛检中,应用前景广阔。在ΔLogistic回归中,对两类判别问力题,记第一类y=0,第二类y=1,则呕根据指标可以建立LogitP关于自变猪量x1,x2…xm的Logistic喝回归方程:LogitP=b0+b1x笤1+b2x2+…+bmxm(3)得概陬率估计公式:=eb0+b1x1+b2台x2+…+bmxm1+eb0+b1x溜1+b2x2+…+bmxm(4)根蕖据估计概率进行判别归类,如果估计概率腺小于,则判为第一类;如果估计概率大于韭,则判为第二类;如果等于,暂不归类。砝对于多分类判别问题,需先建立多分
7、类结果的Logistic回归方程:Lo挞gitPk=lnP(y=k
8、x)P(郎y=0
9、x)=bk+bk1x1+bk2x2+bk3x3+…+bkpxp=稍gk(x)(5)k=1,2,…,k-遁1各类结果的条件概率为:Pk=P[缺y=k
10、x]=egk(x)∑k-1i=0egk(x), k=1,2,…,退k-1(6)分别计算各样品属于各类裳之概率,并根据概率大小判别归类,即属婚于哪一类的概率最大就判别为哪一类[2訇,3,7]。3 Logistic回镜归判别法的应用条件8/8应用Logistic回归做判别预测时,应当注意资料的猬分布类型、资料的收集方法,在正
11、确选择茚模型和了解模型中参数的意义的基础上做珏出判别预测。(1)非条件Logis荒tic回归适合于队列研究、病例对照缫研究,同样也适合于现况调查中的病因学李研究。按3种不同抽样方式作Logis疖tic回归,除病例对照研究资料的常呜数项与另外两种不同外,回归系数的意义ⅶ相同。因此,队列研究和现况调查的非条忉件Logistic回归可直接计算预测踉概率;而病例对照研究的非条件Log对istic回归得不到α的估计值,在得举到模型估计参数α后,需要对常数项进琪行校正,即:α=α-lnn1q0nΚ0q1(7)其中n1和n0分别为病仙例和对照的样本含量,q1和q
12、0为特定瞅人群中发病和不发病的先验概率,可以根狁据经
此文档下载收益归作者所有