logistic回归分析的判别预测功能及其应用

logistic回归分析的判别预测功能及其应用

ID:25252173

大小:56.00 KB

页数:7页

时间:2018-11-19

logistic回归分析的判别预测功能及其应用_第1页
logistic回归分析的判别预测功能及其应用_第2页
logistic回归分析的判别预测功能及其应用_第3页
logistic回归分析的判别预测功能及其应用_第4页
logistic回归分析的判别预测功能及其应用_第5页
资源描述:

《logistic回归分析的判别预测功能及其应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、Logistic回归分析的判别预测功能及其应用【摘要】  目的:介绍Logistic回归模型在判别分析中的应用。方法:结合实例介绍Logistic回归的判别功能的思想、原理、条件和步骤及其在医学领域的应用前景。结果:Logistic回归应用于判别分析时,显示出了较高的准确性和较好的预测效果。结论:Logistic回归在定性和半定量资料的判别和预测方面有一定的优势,结合计算机网络技术的发展在医学领域有较好的应用前景。【关键词】Logistic回归;判别分析;预测;医学应用  Logistic回归分析在医学研究中应用广泛。目前主要是用于流行病学研究中危

2、险因素的筛选,但它同时具有良好的判别和预测功能,尤其是在资料类型不能满足Fisher判别和Bayes判别的条件时,更显示出Logistic回归判别的优势和效能。本研究对Logistic回归方程的判别分析进行了探讨,并用一实例介绍其应用。  1多元Logistic回归模型介绍在多元线性回归模型中,因变量y的取值范围是(-∞,+∞),具体取值取决于自变量的取值范围,而在疾病的危险度分析中,因变量是二分类变量,又称0-1变量,如发病(y=1)与不发病(y=0)。用率P作为因变量,则P的取值范围为(0,1),此时要用自变量的线性组合进行变量的筛选、作用大小

3、的比较和自变量交互作用的研究,就必须通过一个函数关系将因变量P和自变量的线性组合联系起来,这个函数关系便是Logit变换,具体如下:设P为暴露因素为x时个体发病的概率,则发病的概率P与未发病的概率1-P之比称为优势比,LogitP定义为优势比的对数:LogitP=ln(p1-p),此时LogitP的取值范围为(-∞,+∞),多元Logistic回归模型定义为:LogitP=α+β1x1+β2x2+…+βmxm(m为自变量个数)(1)将LogitP看成因变量,Logistic回归就与多元线性回归的形式是一样的[1,2]。  2Logistic回归的判

4、别预测功能及用法在Bayes判别分析中,其后验概率的计算公式为:P(D=1

5、x)=exp(β0+β1x1+…+βpxp)1+exp(β0+β1x1+…+βpxp)(2)此公式和Logistic模型的表达式是完全相同的,其区别在于Bayes判别分析是在各类内指标服从多元正态分布的前提下用判别函数法估计参数,并且需要知道先验概率,而Logistic回归估计参数却没有这一要求。它是直接根据指标情况通过回归模型求出某一事件发生的估计概率。因此,Logistic回归不仅具有判别和预测功能,而且限制条件少,资料要求相对低,适用于定性的或半定量的指标,估计各种自

6、变量组合条件下应变量各级别的发生概率,在临床判别诊断和危险人群筛检中,应用前景广阔。在Logistic回归中,对两类判别问题,记第一类y=0,第二类y=1,则根据指标可以建立LogitP关于自变量x1,x2…xm的Logistic回归方程:LogitP=b0+b1x1+b2x2+…+bmxm(3)得概率估计公式:=eb0+b1x1+b2x2+…+bmxm1+eb0+b1x1+b2x2+…+bmxm(4)根据估计概率进行判别归类,如果估计概率小于0.5,则判为第一类;如果估计概率大于0.5,则判为第二类;如果等于0.5,暂不归类。  对于多分类(类别

7、k>2)判别问题,需先建立多分类结果的Logistic回归方程:LogitPk=lnP(y=k

8、x)P(y=0

9、x)=bk+bk1x1+bk2x2+bk3x3+…+bkpxp=gk(x)(5)k=1,2,…,k-1各类结果的条件概率为:Pk=P[y=k

10、x]=egk(x)∑k-1i=0egk(x),k=1,2,…,k-1(6)分别计算各样品属于各类之概率,并根据概率大小判别归类,即属于哪一类的概率最大就判别为哪一类[2,3,7]。  3Logistic回归判别法的应用条件应用Logistic回归做判别预测时,应当注意资料的分布类型、资料的收集

11、方法,在正确选择模型和了解模型中参数的意义的基础上做出判别预测。(1)非条件Logistic回归适合于队列研究、病例对照研究,同样也适合于现况调查中的病因学研究。按3种不同抽样方式作Logistic回归,除病例对照研究资料的常数项与另外两种不同外,回归系数的意义相同。因此,队列研究和现况调查的非条件Logistic回归可直接计算预测概率;而病例对照研究的非条件Logistic回归得不到α的估计值,在得到模型估计参数α后,需要对常数项进行校正,即:α=α-lnn1q0n0q1(7)其中n1和n0分别为病例和对照的样本含量,q1和q0为特定人

12、群中发病和不发病的先验概率,可以根据经验作出估计。然后再用调整后的α作为Logistic回归方程的常数项就可以计算预测概率

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。