因变量是定性变量的回归分析—Logistic回归分析

因变量是定性变量的回归分析—Logistic回归分析

ID:38689090

大小:94.52 KB

页数:6页

时间:2019-06-17

因变量是定性变量的回归分析—Logistic回归分析_第1页
因变量是定性变量的回归分析—Logistic回归分析_第2页
因变量是定性变量的回归分析—Logistic回归分析_第3页
因变量是定性变量的回归分析—Logistic回归分析_第4页
因变量是定性变量的回归分析—Logistic回归分析_第5页
资源描述:

《因变量是定性变量的回归分析—Logistic回归分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、因变量是定性变量的回归分析—Logistic回归分析一、从多元线性回归到Logistic回归例这是200个不同年龄和性别的人对某项服务产品的认可的数据(logi.sav).其中:年龄是连续变量,性别是有男和女(分别用1和0表示)两个水平的定性变量,而变量“观点”则为包含认可(用1表示)和不认可(用0表示)两个水平的定性变量。从这张图可以看出什么呢?从这张图又可以看出什么呢?这里观点是因变量,只有两个值;所以可以把它看作成功概率为p的Bernoulli试验的结果.但是和单纯的Bernoulli试验不同,这里的概率p为年龄和性别的函数.必须应用Logistic回归。一、多元线性回归不能应用于定性

2、因变量的原因首先,多元线性回归中使用定性因变量严重违反本身假设条件,即:因变量只能取两个值时,对于任何给定的自变量值,e本身也只能取两个值。这必然会违背线性回归中关于误差项e的假设条件。其次,线性概率概型及其问题:由于因变量只有两个值;所以可以把它看作成功概率p,取值范围必然限制在0—1的区间中,然而线性回归方程不能做到。另外概率发生的情况也不是线性的。二、Logistic函数Logistic的概率函数定义为:我们将多元线性组合表示为:于是,Logistic概率函数表示为:经过变形,可得到线性函数:这里,事件发生概率=P(y=1)事件不发生概率=1-P(y=0)发生比:对数发生比:这样,就可

3、将logistic曲线线性化为:从P到logitP经历了两个步骤变换过程:第一步:将p转换成发生比,其值域为0到无穷第二步:将发生比换成对数发生比,其值域科为经过转换,将P→logitP,在将其作为回归因变量来解释就不再有任何值域方面的限制了,即可线性化!一、Logistic回归系数的意义以logitP方程的线性表达式来解释回归系数,即:在logistic回归的实际研究中,通常不是报告自变量对P的作用,而是报告自变量对logitP的作用。以发生比Ω的指数表达式来解释回归系数与logitP不同,发生比Ω具有一定的实际意义,代表一种相对风险。因此对logistic回归系数的解释通常是从发生比的指

4、数表达式出发的。例如:在取得了logistic回归系数的各bi的解以后,将其带入Ω函数,如果分析x变化一个单位对于Ω的影响幅度,可以用(x+1)表示,并将其代入上式,得到新的发生比将两个发生比集中在一起有:将此称为发生比率,它可测量自变量一个单位的增加给原来的发生比所带来的变化,一般表达式为:说明在其他情况不变的情况下,x一个单位的变化使原来的发生比扩大倍。比如,原来的Ω为6:4(比值为1.5),如果一个自变量变化一个单位导致的发生比率为exp(0.693)=2,即表示这一变化将会导致新发生比值Ω*为原来的2倍,即新发生比将是12:4(比值为3)。我们也可用发生比率减1的差来表示发生比的增长

5、率,如发生比率为2.3,就可以说自变量一个单位的变化会使原发生比增加1.3倍(2.3-1=1.3).当logistic回归系数为负数时,发生比率小于1。这时的表达要特别小心。比如发生比率为0.8时,表示新发生比只有原来的80%,那么下降的倍数则是(1-0.8=)0.2.一、Logistic回归应用以上例为例,说明logistic回归分析SPSS选项:Analyze—Regression—BinarylogisticLogistic回归的SPSS输出结果一、Logistic模型的检验与评价1.对于整体模型的检验Logistic回归方程求解参数是采用最大似然估计方法,因此其回归方程的整体检验通过

6、似然函数值,表示为:-2LogLikelihood该值越大,意味着回归方程的似然值越小,模型的拟和程度越差。反之,拟和程度越好。在评价或检验一个含有自变量的Logistic回归模型时,通常是将其含有自变量的Logistic的-2LogLikelihood与截距模型的相比较。两者之差服从卡方分布,进行卡方检验。所谓截距模型,就是将所有自变量删除后只剩一个截距系数的模型。2.对于回归系数的检验Logistic回归系数的检验是用Wald统计量进行的。二、Logistic回归的标准化回归系数SPSS进行Logistic回归时不提供标准化回归系数,但是其手工计算公式很简单:Age和Sex的标准化回归系

7、数分别约为:一、Logistic回归的偏回归系数通过比较两个自变量的标准化回归系数,我们发现对于是否同意该观点来说,年龄的负作用要比性别的负作用要大一些。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。