Logistic回归的实际应用

Logistic回归的实际应用

ID:42800260

大小:235.50 KB

页数:10页

时间:2019-09-21

Logistic回归的实际应用_第1页
Logistic回归的实际应用_第2页
Logistic回归的实际应用_第3页
Logistic回归的实际应用_第4页
Logistic回归的实际应用_第5页
资源描述:

《Logistic回归的实际应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、....Logistic回归的介绍与实际应用摘要本文通过对logistic回归的介绍,对logistic回归模型建立的分析,以及其在实际生活中的运用,我们可以得出所建立的模型对实际例子的数据拟合结果不错。关键词:logistic回归;模型建立;拟合;学习资料....一、logistic回归的简要介绍1、Logistic回归的应用范围:①     适用于流行病学资料的危险因素分析②     实验室中药物的剂量-反应关系③     临床试验评价④     疾病的预后因素分析2、 Logistic回归的分类:①     按因变量的资料类型分:二分类、多分类;其中二分较为常用②     按研究

2、方法分:条  件Logistic回归、非条件Logistic回归两者针对的资料类型不一样,后者针对成组研究,前者针对配对或配伍研究。3、Logistic回归的应用条件是:①     独立性。各观测对象间是相互独立的;②     LogitP与自变量是线性关系;③     样本量。经验值是病例对照各50例以上或为自变量的5-10倍(以10倍为宜),不过随着统计技术和软件的发展,样本量较小或不能进行似然估计的情况下可采用精确logistic回归分析,此时要求分析变量不能太多,且变量分类不能太多;④     当队列资料进行logistic回归分析时,观察时间应该相同,否则需考虑观察时间的影响

3、(建议用Poisson回归)。4、拟和logistic回归方程的步骤:①     对每一个变量进行量化,并进行单因素分析;②     学习资料....数据的离散化,对于连续性变量在分析过程中常常需要进行离散变成等级资料。可采用的方法有依据经验进行离散,或是按照四分、五分位数法来确定等级,也可采用聚类方法将计量资料聚为二类或多类,变为离散变量。③     对性质相近的一些自变量进行部分多因素分析,并探讨各自变量(等级变量,数值变量)纳入模型时的适宜尺度,及对自变量进行必要的变量变换;④     在单变量分析和相关自变量分析的基础上,对P≤α(常取0.2,0.15或0.3)的变量,以及专业

4、上认为重要的变量进行多因素的逐步筛选;模型程序每拟合一个模型将给出多个指标值,供用户判断模型优劣和筛选变量。可以采用双向筛选技术:a进入变量的筛选用score统计量或G统计量或LRS(似然比统计量),用户确定P值临界值如:0.05、0.1或0.2,选择统计量显著且最大的变量进入模型;b剔除变量的选择用Z统计量(Wald统计量),用户确定其P值显著性水平,当变量不显者,从模型中予以剔除。这样,选入和剔除反复循环,直至无变量选入,也无变量删除为止,选入或剔除的显著界值的确定要依具体的问题和变量的多寡而定,一般地,当纳入模型的变量偏多,可提高选入界值或降低剔除标准,反之,则降低选入界值、提高

5、删除标准。但筛选标准的不同会影响分析结果,这在与他人结果比较时应当注意。⑤     在多因素筛选模型的基础上,考虑有无必要纳入变量的交互作用项;两变量间的交互作用为一级交互作用,可推广到二级或多级交互作用,但在实际应用中,各变量最好相互独立(也是模型本身的要求),不必研究交互作用,最多是研究少量的一级交互作用。⑥     对专业上认为重要但未选入回归方程的要查明原因。5、回归方程拟合优劣的判断(为线性回归方程判断依据,可用于logistic回归分析)①     决定系数(R2)和校正决定系数(  ),可以用来评价回归方程的优劣。R2随着自变量个数的增加而增加,所以需要校正;校正决定系数

6、( )越大,方程越优。但亦有研究指出R2学习资料....是多元线性回归中经常用到的一个指标,表示的是因变量的变动中由模型中自变量所解释的百分比,并不涉及预测值与观测值之间差别的问题,因此在logistic回归中不适合。②     Cp选择法:选择Cp最接近p或p+1的方程(不同学者解释不同)。Cp无法用SPSS直接计算,可能需要手工。1964年CLMallows提出:       Cp接近(p+1)的模型为最佳,其中p为方程中自变量的个数,m为自变量总个数。③     AIC准则:1973年由日本学者赤池提出AIC计算准则,AIC越小拟合的方程越好。在logistic回归中,评价模型拟

7、合优度的指标主要有Pearson χ2、偏差(deviance)、Hosmer-Lemeshow(HL)指标、Akaike信息准则(AIC)、SC指标等。Pearson χ2、偏差(deviance)主要用于自变量不多且为分类变量的情况,当自变量增多且含有连续型变量时,用HL指标则更为恰当。Pearsonχ2、偏差(deviance)、Hosmer-Lemeshow(HL)指标值均服从χ2分布,χ2检验无统计学意义(P>0.05)表示模型拟合的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。