欢迎来到天天文库
浏览记录
ID:42563557
大小:170.95 KB
页数:7页
时间:2019-09-17
《logistic回归模型 SPSS例析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Logistic回归Logistic回归是多元回归分析的拓展,其因变量不是连续的变量;在logistic分析中,因变量是分类的变量;logistic和probit回归皆为定性回归方程的一种;他们的特点就在于回归因变量的离散型而非连续型。Logistic回归又分为binary和multinominal两类;1、Logistic回归原理Logistic回归Logistic回归模型描述的是概率P与协变量之间的关系,考虑到P的取值在0----1之间,为此要首先把Plogistic变换为,使得它的取值在之间,然后建立logistic回归模型P=p(Y=1)=Logistic回归模型的数据结构观察值个
2、数取1的观察值个数取0的观察值个数协变量的值N1r1n1-ri………………………N2r2n2-r2……………………….........Ntrtnt-rt……………………….根据数据,得到参数的似然函数使用迭代算法可以求得的极大似然估计。2、含名义数据的logistic模型婚姻状况是名义数据,分为四种情形:未婚、有配偶、丧偶、离婚;在建立logistic模型时,定义变量M1、M2、M3,使得(M1=1,M2=0,M3=0)表示未婚;(M1=0,M2=1,M3=0)表示有配偶(M1=0,M2=0,M3=1)表示丧偶(M1=-1,M2=-1,M3=-1)表示离婚也可以将三变量定义为(M1=1,M
3、2=0,M3=0)表示未婚;(M1=0,M2=1,M3=0)表示有配偶(M1=0,M2=0,M3=1)表示丧偶(M1=0,M2=0,M3=0)表示离婚一般来说,只要矩阵非奇异,可以定义(M1=a1,M2=b1,M3=c1)表示未婚;(M1=a2,M2=b2,M3=c2)表示有配偶(M1=a3,M2=b3,M3=c3)表示丧偶(M1=a4,M2=b4,M3=c4)表示离婚3、含有有序数据的logistic回归文化程度是有序的定性变量,他有一个顺序,由低到高为文盲、小学、中学、高中、中专;大学。常用数字来表示顺序变量,例如用0、1、2、3、4、5表示文化程度由低到高。4、multinomina
4、l多项logistic回归模型以上讨论的都是二值logistic回归,实际问题中有许多响应变量是多值的情形,这时就需要用到多值logistic回归;Nominal型的响应变量:研究三个学校和两个不同的课程计划对学生偏好何种学习方式的影响。其相应变量学习方式y=1自修、y=2小组、y=3上课;学校课程计划学习方式合计X1x2x3y=1y=2y=3(10)x3=05125067X3=110172653(01)x3=016123674X3=121172664(00)x3=012122044X3=115151646在响应变量是名义变量时,挑选她的一个值作为参照物,让其他值与其作比较,这里以y=3上
5、课作为参照物。令p1、p2、p3分表表示学生偏爱自修小组、上课的概率;以上课作为参照建立logistic模型。从而有然后参照二值logistic模型得到多项logistic回归模型参数八个参数的最大似然估计。Ordinal型的响应变量:研究性别和不同的两种疗法对某种疾病疗效的影响性别疗法疗效合计X1x2显著较有效无效男新疗法x2=152714X=0旧疗法x2=0101011女新疗法x2=1165627X=1旧疗法x2=0671932令p1、p2、p3分别表示显著、较有效、无效的概率。建立有序响应变量的多项logistic回归模型。得到然后计算四个参数的最大似然估计。Nominal和ordi
6、nal模型的不同要注意,特别是在协变量系数方面的区别。例1:50例急性淋巴细胞性白血病患者,在入院时取得外周血中的细胞数X1(千个/mm^3),淋巴浸润等级X2(分0,1,2,3四个等级),出院后巩固治疗X3(有巩固治疗为1,无0),并随访取得患者的生存时间t月,变量y(生存时间1年以上为1,1年以内为0),进行非条件的logistic回归建模。Analyze--àregression---àbinarylogistic模型系数整体检验是显著的CCR^2和NR^2相当于线性回归的R^2,代表方程对因变量方差的解释程度。此项也是用来检验模型的拟合度,p=0.924>0.05,也就是接受这一回
7、归方程。检验模型的判断正确率。检验各个变量的回归系数是否显著。本题采用的是enter法,可删去不显著的变量,再做建模。
此文档下载收益归作者所有