欢迎来到天天文库
浏览记录
ID:52457134
大小:386.28 KB
页数:15页
时间:2020-03-27
《利用SPSS进行Logistic回归分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、研究生地理数学方法(实习)Part2统计分析软件SPSS第8章利用SPSS进行Logistic回归分析现实中的很多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0和1表示。如果我们采用多个因素对0-1表示的某种现象进行因果关系解释,就可能应用到logistic回归。Logistic回归分为二值logistic回归和多值logistic回归两类。首先用实例讲述二值logistic回归,然后进一步说明多值logistic回归。在阅读这部分内容之前,最好先看看有关SPSS软件操作技术的教科书。§8.1二值logistic回归8.1.1数据准备和选项设置我们
2、研究2005年影响中国各地区城市化水平的经济地理因素。城市化水平用城镇人口比重表征,影响因素包括人均GDP、第二产业产值比重、第三产业产值比重以及地理位置。地理位置为名义变量,中国各地区被分别划分到三大地带:东部地带、中部地带和西部地带。我们用各地区的地带分类代表地理位置。第一步:整理原始数据。这些数据不妨录入Excel中。数据整理内容包括两个方面:一是对各地区按照三大地带的分类结果赋值,用0、1表示,二是将城镇人口比重转换逻辑值,变量名称为“城市化”。以各地区2005年城镇人口比重的平均值45.41%为临界值,凡是城镇人口比重大于等于45.41%的地区,逻辑值用
3、Yes表示,否则用No表示(图8-1-1)。图8-1-1原始数据(Excel中,局部)将数据拷贝或者导入SPSS的数据窗口(DataView)中(图8-1-2)。1研究生地理数学方法(实习)Part2统计分析软件SPSS图8-1-2中国31个地区的数据(SPSS中,局部)第二步:打开“聚类分析”对话框。沿着主菜单的“Analyze→Regression→BinaryLogisticK”的路径(图8-1-3)打开二值Logistic回归分析选项框(图8-1-4)。图8-1-3打开二值Logistic回归分析对话框的路径对数据进行多次拟合试验,结果表明,像二产比重、三
4、产比重等对城市化水平影响不显2研究生地理数学方法(实习)Part2统计分析软件SPSS著。至于反映地区位置的分类变量,不宜一次性的全部引入,至多引入两个,比方说东部和中部。通过尝试,发现引入中部地带为变量比较合适。因此,为了实例的典型性,我们采用两个变量作为自变量:一是数值变量人均GDP,二是分类变量中部地带。图8-1-4Logistic回归分析选项框第三步:选项设置。首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入Dependent(因变量)和Covariates(协变量)列表框中(图8-1-5)。在本例中,将名义变量“城市化”调入
5、Dependent(因变量)列表框,将“人均GDP”和“中部”调入Covariates(协变量)列表框中。在Method(方法)一栏有七个选项。采用第一种方法,即系统默认的强迫回归方法(Enter)。3研究生地理数学方法(实习)Part2统计分析软件SPSS图8-1-5Logistic回归分析的初步设置接下来进行如下4项设置:⒈设置Categorical(分类)选项:定义分类变量(图8-1-6)。将中部调入CategoricalCovariates(分类协变量)列表框,其余选项取默认值即可。完成后,点击Continue继续。图8-1-6定义分类变量选项⒉设置Sav
6、e(保存)选项:决定保存到DataView的计算结果(图8-1-7)。选中Leveragevalues、DfBeta(s)、Standardized和Deviance四项。完成后,点击Continue继续。4研究生地理数学方法(实习)Part2统计分析软件SPSS图8-1-7Logistic回归分析的存储选项⒊设置Options:有三个选项区(图8-1-5)。第一个是StatisticsandPlots(统计和画图)选项,包括六种可以兼容的选择(复选项)。选中Classificationplots、Hosmer-Lemeshowgoodness-of-fit和CI
7、forexp(B)三个选项。第二个是Display(显示)选项,选择Atlaststep(最后一步),这样,输出结果将仅仅给出最终结果,而省略每一步的计算过程。由于我们采用强迫回归,ProbabilityforStepwise(逐步回归概率)选项可以不管。5研究生地理数学方法(实习)Part2统计分析软件SPSS图8-1-8Logistic回归分析的选项设置此外还有一个选项需要说明。一是Classificationcutoff(分类临界值),默认值为0.5,即按四舍五入的原则将概率预测值化为0或者1。如果将数值改为0.6,则大于等于0.6的概率值才表示为1,否则为
8、0。其情况
此文档下载收益归作者所有