欢迎来到天天文库
浏览记录
ID:38229295
大小:1.27 MB
页数:4页
时间:2019-05-25
《基于R的有序分类资料logistic回归分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、软件2014年第35卷第6期设计研究与应用基于R的有序分类资料logistic回归分析韦杰,曾萍(贵阳中医学院基础医学院,贵州贵阳,550002)摘 要:本文描述有序分类资料的logistic回归模型及参数估计与假设检验,以R语言作为分析工具,利用程序包MASS中的polr函数对数据文件进行回归系数的估计及模型拟合检验,从而完成统计推断。关键词:有序分类;logistic回归模型;R语言中图分类号:O212.1 文献标识码:A DOI:10.3969/j.issn.1003-6970.2014.06.015本文著录格式:[1]韦杰,曾萍
2、.基于R的有序分类资料logistic回归分析[J].软件,2014,35(6):56-57TheLogisticRegressionwereUsedtoAnalyzeOrdinalDataonRLanguageWEIJie,ZENGPing(GuiYangCollegeofTraditionalChineseMedicine&BasicMedicalDepartmentGuiZhouGuiYang550002)【Abstract】ThisarticledescribestheOrdinaldatafoundedlogisticregressionmode
3、l,parameterestimationandhypoth-esistesting;UsingRlanguageastheanalysistool,thedatawereanalyzedbyestimationofregressioncoefficientandModelfittingtestusingPolrfunctioninMASSpackage,thusfinishedthestatisticalinference.【Keywords】Ordinaldata;logisticregressionmodel;Rlanguage0 引言线性回归模型在定量分
4、析的实际研究中也许是最流行的统计分析方法,然而在许多情况下,当反应变量是一个分[1]类变量而不是一个连续变量,这时候线性回归就不适用了,此时可以采用logistic回归分析。logistic回归是一种研究[2]两水平或多水平的反应变量与影响因素间曲线关系的回归分析。logistic回归的反应变量(因变量)可以是二分类的,也可以是多分类的,二分类的情况具有一般性,但在实际中也可能会遇到多分类的情况。多分类logistic回归模型又可以分成两种不同的情况,第一种为反应变量是无序分类资料,如血型分为:A型、B型、AB型、O型;第二种为反应变量是有序分类资料(等级
5、资料),如疗效分为:痊愈、显效、微效、无效。当反应变量是有序分类资料时,对数据采用有序分类logistic回归模型进行分析。1 有序分类logistic回归模型下面用实例来描述该模型,数据见表1,设反应变量疗效(Y)为不同治疗方法治疗某病的效果,它有3个类别,p1、p2、p3分别表示疗效为显效、有效、无效的概率,且满足p1+p2+p3=1。模型中有2个自变量,它们分别是性别(x1)与治疗方法(x2),建立有序分类logistic回归模型为:其中,αi和βi(i=1,2)分别表示模型中的截距和回归系数。若反应变量中有K个类别,有序分类logistic回归模型
6、中就有K-1个logit模型,所以K=3时,就有2个logit模型,从有序分类logistic回归模型得到:eα1+β1x1+β2x2eα2+β1x1+β2x2eα1+β1x1+β2x2p=,p=−,p3=1-p1-p211+eα1+β1x1+β2x221+eα2+β1x1+β2x21+eα1+β1x1+β2x2作者简介:韦杰(1979-),男,讲师,硕士,主要研究方向为应用统计及非参数检验。软件杂志欢迎推荐投稿:cosoft@163.com56韦杰,曾萍:基于R的有序分类资料logistic回归分析2 参数估计与检验对于logistic回归模型的分析需要
7、根据样本数据,求出回归模型中截距和各个自变量的回归系数,通常采用最大似然法求出回归系数的估计值,当求出回归系数后要对回归系数进行检验,并建立回归方程,以此来描述反应变量与自变量之间的关系。回归系数的检验方法主要有似然比检验,检验目的是检验总体回归系数是否为零,该法通过比较有嵌套关系的两个模型的对数似然函数变化所进行的,其检验统计量G=-2ln(L2/L1),其中L1为所设定原模型的最大似然函数的对数,L2为简化模型的最大似然函数的对数,在大样本时,G近似地服从自由度为省略自变量个数的卡方分布。logistic回归模型的拟合检验是通过比较模型预测数和实际观测
8、数有无差别来进行检验,如果预测的值与实际观测的值越接近,说明模型的
此文档下载收益归作者所有