欢迎来到天天文库
浏览记录
ID:37209084
大小:416.60 KB
页数:43页
时间:2019-05-11
《多元logistics回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、多元Logistics回归分析李忠良华中科技大学同济医学院内容基本原理数学模型方法步骤系数解释条件Logistics分析应用内容基本原理数学模型方法步骤系数解释条件Logistics分析应用从数学角度看,logistic回归模型非常巧妙地避开了分类型变量的分布问题,补充完善了线性回归模型和广义线性回归分析的缺陷。因变量y是分类型变量,自变量x是与之有关的一些因素。但是,这样的问题却不能直接用线性回归分析方法来解决,其根本原因就在于因变量是分类型变量,严重违背了线性回归分析对数据的假设条件。从数学角度看,很难找到一个函数y=f(x),当x变化时,它对应的函数值y
2、仅取两个或几个有限值。研究者将所要研究的问题转换了一个角度,不是直接分析y与x的关系,而是分析y取某个值的概率p与x的关系。分析因变量y取某个值的概率p与自变量x的关系,等价于寻找一个连续函数p=p(x),使得当x变化时,它对应的函数值p不超出[0,1]范围。数学上这样的函数是存在且不唯一的,logistic回归模型就是满足这种要求的函数之一。根据数据的类型,logistic回归分析分为两种:一种是条件logistic回归(conditionallogisticregression),用于分析配对病例对照研究数据。另一种是非条件logistic回归(uncon
3、ditionallogisticregression),用于分析成组数据或非配对的病例对照研究。非条件logistic回归分析也简称为logistic回归分析。内容基本原理数学模型方法步骤系数解释条件Logistics分析应用logistic回归模型对变量的要求Logistic回归分析要求因变量是分类变量,包括顺序变量和名义变量。不论是哪种变量都要用数字来表示它的取值。自变量可以是数值型连续变量,也可以是顺序型分类变量,如果是名义变量,则需要转换成哑变量来处理。logistic回归模型的个数取决于因变量的取值个数。因为logistic回归模型描述的是因变量取每
4、个值的概率与自变量的关系,因此因变量的每一个值都对应一个模型。但是由于概率之和为1,所以当因变量是g值变量时,只需要估计g-1个模型二值因变量的logistic回归模型假设因变量y是一个取值为1和0的二值变量(binaryvariable),x是一个影响y的危险因子(riskfactor)。令在x条件下y=1的概率是p=p(y=1
5、x),那么,表达式:多元logistic回归模型如果对模型的概率p进行logit变换logistic回归模型的另一种形式,它给出的是变量z=logit(p)关于x的线性函数多值变量的logistic回归模型pj=p(y≤j
6、x),它
7、表示了y取前j个值的累积概率(cumulativeprobability)。累积概率函数第一个模型表示了y取第一个值的概率p1与x的关系;第二个模型表示了y取前两个值的累积概率p2与x的关系。这两个模型的常数项不同,回归系数完全相同的。y取第一个值的概率p(1)=p1,y取第二个值的概率p(2)=p2-p1,y取第三个值的概率p(3)=1-p2。它们的截距不同,斜率相同,所以是g-1条平行直线族。多值因变量logistic回归模型要求进行数据的平行性检验。内容基本原理数学模型方法步骤-参数估计-检验参数-模型检验-平行性检验系数解释条件Logistics分析应
8、用参数估计在logistic回归分析模型中,回归系数的估计方法通常是最大似然法(MaximumLikelihoodmethod)。最大似然法就是选取使得总体真参数落在样本观察值领域里的概率达到最大的参数值作为真参数的估计值。为了得到一个非偏估计(non-biasedestimate),需采用重复递推的方法,将最大似然估计值不断修正。软件系统使用的是重复加权最小二乘递推法(iterativelyreweightedleastsquaresalgorithm)来估计回归系数。和线性回归分析一样,logistic回归模型的回归系数是自变量对应变量作用大小的一种度量。
9、因为自变量的单位不同,不能用回归系数的估计值来判断哪一个自变量对因变量的影响作用最大。为了要进行比较,需要计算出标准回归系数。计算原理和线性回归分析一样。在标准回归系数估计值中,绝对值最大的标准回归系数对应的x变量对y变量的影响最大。检验参数统计假设常用的方法是Ward卡方检验。当大于样本对应的Ward卡方值的概率小于0.05时,在统计意义上可以拒绝上述零假设。即,可以认为第j个x变量对y=1的概率p有显著性影响,其犯第一类错误的可能性不超过5%。和线性回归分析一样,当自变量个数较多时,可采用逐步回归分析方法来筛选危险因子。模型检验logistic回归模型的总
10、体检验常用的方法有:AIC检验法(Ak
此文档下载收益归作者所有