欢迎来到天天文库
浏览记录
ID:7236672
大小:462.00 KB
页数:35页
时间:2018-02-08
《spss19.0软件使用教程合集》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
SPSS19.0软件使用教程合集SPSS(StatisticalPackagefortheSocialScience)--社会科学统计软件包是世界是著名的统计分析软件之一。20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。20世纪80年代以前,SPSS统计软件主要应用于企事业单位。1984年SPSS总部首先推出了世界第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,从而确立了个人用户市场第一的地位。同时SPSS公司推行本土化策略,目前已推出9个语种版本。SPSS/PC+的推出,极大地扩充了它的应用范围,使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。目前已经在国内逐渐流行起来。它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。 SPSSforWindows是一个组合式软件包,它集数据整理、分析功能于一身。用户可以根据实际需要和计算机的功能选择模块,以降低对系统硬盘容量的要求,有利于该软件的推广应用。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。 SPSSforWindows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,现已推广到多种各种操作系统的计算机上,它和SAS、BMDP并称为国际上最有影响的三大统计软件。和国际上几种统计分析软件比较,它的优越性更加突出。在众多用户对国际常用统计软件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab的总体印象分的统计中,其诸项功能均获得最高分。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。最新的12.0版采用DAA(DistributedAnalysisArchitechture,分布式分析系统),全面适应互联网,支持动态收集、分析数据和HTML格式报告,依靠于诸多竞争对手。但是它很难与一般办公软件如Office或是WPS2000直接兼容,在撰写调查报告时往往要用电子表格软件及专业制图软件来重新绘制相关图表,已经遭到诸多统计学人士的批评;而且SPSS作为三大综合性统计软件之一,其统计分析功能与另外两个软件即SAS和BMDP相比仍有一定欠缺。 虽然如此,SPSSforWindows由于其操作简单,已经在我国的社会科学、自然科学的各个领域发挥了巨大作用。该软件还可以应用于经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各个领域。 例1.1某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)?患者:0.841.051.201.201.391.531.671.801.872.072.11健康人:0.540.640.640.750.760.811.161.201.341.351.481.561.87 让我们把要做的事情理理顺:首先要做的肯定是打开计算机(废话),然后进入瘟98或瘟2000(还是废话,以下省去废话2万字),在进入SPSS后,具体工作流程如下:1.将数据输入SPSS,并存盘以防断电。2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。3.按题目要求进行统计分析。4.保存和导出分析结果。下面就按这几步依次讲解。§1.1数据的输入和保存1.1.1SPSS的界面当打开SPSS后,展现在我们面前的界面如下:请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。请注意窗口顶部显示为“SPSSforWindowsDataEditor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、工具栏。特别的,工具栏下方的是数据栏,数据栏下方则是数据管理窗口的主界面。该界面和EXCEL极为相似,由若干行和列组成,每行对应了一条记录,每列则对应了一个变量。由于现在我们没有输入任何数据,所以行、列的标号都是灰色的。请注意第一行第一列的单元格边框为深色,表明该数据单元格为当前单元格。对Windows操作界面不熟悉的朋友可参见SAS入门第一课中的相关内容。对数据表界面操作不熟悉的朋友可先学习一下EXCEL的操作(因为它的帮助是中文的)。 有的SPSS系统打开时会出现一个导航对话框,请单击右下方的Cancer按钮,即可进入上面的主界面。1.1.2定义变量该资料是定量资料,设计为成组设计,因此我们需要建立两个变量,一个变量代表血磷值,习惯上取名为X,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为GROUP。对数据的统计分析格式不太熟悉的朋友请先学习统计软件第一课。选择菜单Data==>DefineVariable。系统弹出定义变量对话框如下:该变量定义对话框在SPSS10.0版中已被取消,这里的操作只适合9.0~7.0版的用户。对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。好,先来建立分组变量GROUP。请将变量名改为GROUP,然后单击OK按钮。 有没有搞错?!折腾了半天就改个名字!难道连变量格式、标签等都不改?是这样的,在SPSS中所有的数据均以最大位数保存(好象是双精度),也就是说,上面虽然默认只有两位小数,但那指的是计算精度,实际保存的数据位数是非常长的(可以输入Pi值试一下)。在绝大多数情况下,SPSS给出的默认数据类型和数据精度完全可以满足需要,只是不太好看而已。至于标签等比较花哨的选项,反正我也很少用。现在我们才刚刚入门,一切从简。以后我会详细介绍各种设置的用法。在第一列灰色的“var”上双击,同样会弹出定义变量对话框。现在SPSS的数据管理窗口如下所示:第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。现在我们来建立变量X。单击第一行第二列的单元格,然后选择菜单Data==>DefineVariable,同样,将变量名改为X,然后确认。此时SPSS的数据管理窗口如下所示: 现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。1.1.3输入数据我们先来输入变量X的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一个数据0.84,此时界面显示如图A所示:图A图B请注意:在回车之前,你输入的数据在数据栏内显示,而不是在单元格内显示,现在回车,界面如图B所示:首先,当前单元格下移,变成了二行二列单元格,而一行二列单元格的内容则被替换成了0.84;其次,第一行的标号变黑,表明该行已输入了数据;第三,一行一列单元格因为没有输入过数据,显示为“.”,这代表该数据为缺失值。用类似的输入方式,我们将患者的血磷值输入完毕,并将相应的变量GROUP均取值为1,此时数据管理窗口如下所示: 从第12行开始输入健康人的数据,并将相应的GROUP变量取值为2。最终该数据集应该有24条记录。1.1.4保存数据选择菜单File==>Save,由于该数据从来没有被保存过,所以弹出Saveas对话框如下:单击保存类型列表框,可以看到SPSS所支持的各种数据类型,有DBF、FoxPro、EXCEL、ACCESS等,这里我们仍然将其存为SPSS自己的数据格式(*.sav文件)。在文件名框内键入Li1_1并回车,可以看到数据管理窗口左上角由Untitled变为了现在的变量名Li1_1。为什么这里的对话框会出现汉字?是这样的,需要从编程的角度来解释:SPSS在弹出该对话框时会调用Windows系统的公用函数,由于我们用的是中文Windows系统,所以调用出来的就是中文。§1.2数据的预分析1.2.1数据的简单描述首先我们需要知道数据的基本情况,如均数、标准差等。选择Analyze==>DescriptiveStatistics==>Descriptives菜单,系统弹出描述对话框如下: 如果按SPSS标准的叫法,这里应该是调用了Descriptives过程,为了避免太生硬,我们称为调用对话框,等大家熟悉SPSS了以后,在统计分析各章中可能两种称呼会混用。该对话框可分为左右两大部分,左侧为所有可用的侯选变量列表,右侧为选入变量列表。我们只需要描述X,用鼠标选中X,单击中间的,变量X的标签就会移入右侧,注意这时OK按钮变黑,表明已经可以进行分析了,单击它,系统会弹出一个新的界面如下所示:该窗口上方的名称为SPSSforWindows Viewer,即(结果)浏览窗口,整个的结构和资源管理器类似,左侧为导航栏,右侧为具体的输出结果。结果表格给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量。从中可以看到,24个数据总的均数为1.2846,标准差为0.4687。我们以上的做法对吗?当然有问题!光看总的描述是不够的,还应当看看分组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择Data==>SplitFile菜单,系统弹出文件分割对话框如下:选择单选按钮Organizeoutputbygroups,将变量GROUP选入右侧的选入变量框,单击OK钮,此时界面不会有任何改变,但请再做一次数据描述,你就可以看到现在数据是分Group=1和Group=2两种情况在描述了!从描述可知两组的均数和标准差分别为1.5209、1.0846和0.4218、0.4221。如果定义了文件分割,则它会在以后的所有统计分析中起作用,直到你重新定义文件分割方式为止。1.2.2绘制直方图统计指标只能给出数据的大致情况,没有直方图那样直观,我们就来画个直方图瞧瞧!选择Graphs==>Histogram,系统会弹出绘制直方图对话框如下: 将变量X选入Variable选择框内,单击OK按钮。此时结果浏览窗口内会绘制出如下两个直方图:两组的数据没有特别偏的分布,也没有十分突出的离群值,因此无须变换,可以直接采用参数分析方法来分析。综合设计类型,最终确定采用成组设计两样本均数比较的t检验来分析。最后,我们还要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“Analyzeallcases,donotcreatgroup”,单击OK按钮就可以了。§1.3按题目要求进行统计分析下面我们要用SPSS来做成组设计两样本均数比较的t检验,选择Analyze==>CompareMeans==>Independent-SamplesTtest,系统弹出两样本t检验对话框如下: 将变量X选入test框内,变量group选入grouping框内,注意这时下面的DefineGroups按钮变黑,表示该按钮可用,单击它,系统弹出比较组定义对话框如右图所示:该对话框用于定义是哪两组相比,在两个group框内分别输入1和2,表明是变量group取值为1和2的两组相比。然后单击Continue按钮,再单击OK按钮,系统经过计算后会弹出结果浏览窗口,首先给出的是两组的基本情况描述,如样本量、均数等(糟糕,刚才的半天工夫白费了),然后是t检验的结果如下:IndependentSamplesTest Levene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpperXEqualvariancesassumed.032.8602.52422.019.4363.17297.777E-02.7948 Equalvariancesnotassumed 2.52421.353.020.4363.17297.716E-02.7954可见该结果分为两大部分:第一部分为Levene's方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F=0.032,p=0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t=2.524,ν=22,p=0.019。从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。§1.4保存和导出分析结果1.4.1保存结果文件前面我们已经做出了分析结果,但是,可是,可但是,但可是呢?再好的结果只要一断电就会全部消失(废话),对于这一问题人们早已想出了三种解决办法,他们分别是:·需要结果的时候再运行一次分析程序。·用笔将结果抄在纸上。·直接保存结果文件。显然,最方便快捷、最符合信息时代特征的就是第三种方法,在结果浏览窗口中(注意:一定要在结果浏览窗口中)选择菜单File==>Save,由于该结果也从来没有被保存过,所以弹出和前面保存数据时极为相似的一个Saveas对话框,和前面相比,他唯一的区别就是文件的保存类型只有ViewFiles(*.spo)一种。好,闲言少叙,在文件名框中键入“Li1_1”并回车,该结果文件就会按文件名Li1_1.spo被存储。不是文件保存类型还有一种“ALLFiles(*.*)”吗?别费劲了,这种类型是SPSS公司放在那里哄人的,在该对话框里无论怎么折腾,都只能按SPO文件的格式来保存。1.4.2导出分析结果文件倒是保存了,但问题还没有完全解决:我们从来写文章什么的都用的是文字处理软件,尤其是WORD,可WORD不能直接读取SPO格式的文件,怎么办呢?没关系,SPSS提供了将结果导出为纯文本格式或网页格式的功能,在结果浏览窗口中选择菜单File==>Export,系统会弹出ExprotOutput对话框如下: 最上方的Export下拉式列表可以选择输出的内容,可以为含图表的输出文档、无图表的输出文档和只有统计图表三种;中部的ExprotFile对话框则填入输出的目标文件名;左下方的ExportWhat单选框可以选择输出结果的哪些部分,可以是所有结果、所有可见结果或只输出选择的结果,一般选输出所有可见结果;右下方的输出文件类型下拉式列表已被我打开,可见里面有网页格式和纯文本格式两种,在一切按所需选择完毕后按OK钮,则结果文件就会输出为你想要的类型。好,到这里,就象我们刚开始所说的一样,你实际上已经完全掌握了SPSS的基本使用方法。我们以后将要做的工作就是“百尺竿头,更进一步”,将从下一章开始详细介绍SPSS各个模块的精确用法,使大家能尽快的从SPSS新手向SPSS高手过度。 §2.1 建立与保存数据文件和大多数应用软件相同,SPSS中数据文件的管理功能基本上都集中在了File菜单上,该菜单的组织结构和WORD等也极为相似,因此这里我们只介绍比较有特色的几个菜单项。SPSS10.0有三个主要窗口界面:数据管理窗口、程序编辑窗口和结果浏览窗口;另有两个不常用的窗口:结果草稿浏览窗口和VBs脚本语言编辑窗口。他们共享许多菜单项,如File菜单就大部分相同,这里介绍的许多内容在五个窗口中都是通用的。2.1.1 新建数据文件如果你正从头开始进行一个新的课题,刚刚把数据收集上来,要做统计分析,自然需要新建一个数据库,然后将所有的数据从纸上请到计算机里。在SPSS中,新建一个数据库容易的不得了--已经到了什么都不用做的地步!是这样,当你进入SPSS系统时,系统就已经生成了一个空数据文件,即你看到的空白的数据管理界面。你只要按自己的需要定义变量,输入数据然后存盘就是了(这些操作马上会讲到)。2.1.2 打开其他格式的数据文件 凡是做过数据输入工作的人都知道:这活又费眼睛又累人,出错太多了还要挨批评,非常影响个人的光辉形象。算了,还是在有限的经费里划几百美元出来雇个打字小姐吧(怎么用美元?因为我请了个老外!)。可是非常不幸,该同志只会用EXCEL2000(又是一个被微软成功洗脑的家伙),数据现已输好,怎么转成SPSS数据文件呢?没关系,SPSS提供了以下几种方法来打开其他格式的数据文件。2.1.2.1 直接打开SPSS现在可以直接读入许多格式的数据文件,其中就包括EXCEL各个版本的数据文件。选择菜单File==>Open==>Data或直接单击快捷工具栏上的“”按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是:SPSS(*.sav)SPSS数据文件(6.0~10.0版)SPSS/PC+(*.sys)SPSS4.0版数据文件Systat(*.syd)*.syd格式的Systat数据文件Systat(*.sys)*.sys格式的Systat数据文件SPSSportable(*.por)SPSS便携格式的数据文件EXCEL(*.xls)EXCEL数据文件(从5.0版~2000版)Lotus(*.w*)Lotus数据文件SYLK(*.slk)SYLK数据文件dBase(*.dbf)dBase系列数据文件,(从dBaseII~IV)Text(*.txt)纯文本格式的数据文件data(*.dat)纯文本格式的数据文件选择所需的文件类型,然后选中需要打开的文件,SPSS就会按你的要求打开你要使用的数据文件,并自动转换为数据SPSS格式。也许有视力好的朋友会注意到右下方除了“打开”和“取消”两个按钮外,中间还有一个“Paste”按钮,该按钮在SPSS的大多数对话框中都存在,是用于自动生成SPSS程序的,我们以后会专门讲解该问题。2.1.2.2 使用数据库查询打开SPSS可以直接打开许多类型的数据文件,但这并不是说它可以打开所有类型的数据文件(废话),比如FoxPro3.0以上版本的*.dbf文件就不能直接打开(有兴趣的话你可以试试)。为此,SPSS还提供了另一个适用范围更广、但使用上较为专业的数据接口--数据库查询。 实际上,SPSS在这里使用的是一种叫ODBC(OpenDatabaseCapture)的数据接口,该接口被大多数数据库软件和办公软件(如MSOffice)支持,通过它,应用程序可以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管理系统。由于SPSS10.0可以直接打开EXCEL所有系列的数据文件,因此数据库查询接口的用处不是很大。但是,在9.0及以前的版本中,该查询仍是直接打开EXCEL95、97及2000数据文件的唯一办法。ODBC数据引擎是独立与各种应用软件,直接安装到Windows系统中的,因此你所用的系统中ODBC所支持的数据类型取决于所安装的ODBC引擎的情况。还好,大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如MSOffice)。不过有一点要提醒大家,许多机器的OBDC数据引擎安装有问题(尤其是D版),在SPSS中使用它往往要死机。选择菜单File==>OpenDatabase==>NewQuery,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。我原来准备举一个具体例子,但后来发现不同版本的ODBC引擎所弹出的对话框并不相同!不仅如此,不同的数据驱动程序其对话框也各不相同!比如说,有的需要你的LoginID和Password,有的又不需要,因此我这里就不再讲了。由于它使用上太专业(尤其在10.0版中,9.0版还好些),如果确实要用,请找一个对数据库接口比较熟的人来帮你。2.1.2.3 使用文本导入向导读入文本文件选择菜单File==>ReadTextData,系统就会弹出OpenFile对话框,对!和前面的情况完全一样,只是文件类型自动跳到了Text(*.txt)。实际上,该功能在SPSS中已被整合到了OpenFile对话框中之所以在菜单上保留该条目有两个原因:1.读入纯文本的情况非常普遍,放在这里更加醒目;2.为了和SPSS老版本的使用上保持兼容。例2.1现有一数据文件以纯文本的形式存为“c:Li2_1.txt”,且第一行为变量名,请将其读入SPSS。解:在OpenFile对话框选中相应的文件名并单击“确定”,系统会自动启动文本导入向导对话框如下: 在SPSS10.0中,该向导并没有重新设计,因此仍然有问题被截断无法显示完的情况出现。可以看到该向导共分6步,这是第一步。中部为一对单选按钮,问题为“你的文本文件和预定义格式相一致吗?”,下方为按预定义格式读入的数据文件的预览。显然,SPSS的预定义格式并没有正确识别该文件。因此选择“No”并单击“下一步”,系统弹出向导的下一个对话框如下: 最上方的问题是“你的变量是如何排列的?”,下面的选项分别为Delimite(用某种字符区分)和FixedWidth(固定宽度),一般都是Delimite,第二个问题是“变量名包括在文件最前面了吗?”,我们当然选“Yes”,单击“下一步”,系统弹出第三个对话框:最上方的句子意为“第一条记录从第几行开始?”,右侧可以输入行数。由于我们所用的数据第一行为变量名,因此这里输入2。下面的问题是“你的记录是怎样存储在文件中的?”。可以是“每一行代表一条记录”,或者“每**个变量代表一条记录”,数据一般都是第一种情况。下一个问题是“你想导入多少条记录?”,可以是“所有记录”、“前**条”或“随机导入**%的记录”。一般也选前者。单击“下一步”,第四个对话框如下:我这里写的非常详细,但实际使用中你可以不管大多数问题,因为SPSS一般都能自动正确设置。 最上方的问题为“变量间用的是哪种分隔符?”,可选的有Tab键、空格、逗号、分号或自行定义的其他符号。本数据采用的是空格,可见系统已经自动识别并选择了空格,而下方的数据预览窗口显示出了正确的数据读入情况。单击“下一步”,第五个对话框如下:上方的提示为“定义在数据预览窗口中所选择的变量。”。顾名思义,在这个对话框中你可以在数据预览窗口中选择某一列变量,然后更改其变量名和类型。当然,在这里我们不用这样做,直接单击“下一步”,系统弹出文本导入向导的最后一个对话框如下: 最上面的问题为“你愿意保存这次的文件(读入)格式设置以备下次使用吗?”,第二个问题为“你是否愿意将以上操作粘贴为SPSS语句?”,一般这两个问题我们都可以不管。单击“完成”,系统最终成功的读入了Li2_1.txt。2.1.3 保存数据文件在对数据做了修改后,保存数据文件是必不可少的工作之一。选择菜单File==>Save,如果数据文件曾经存储过,则系统会自动按原文件名保存数据;否则,就会弹出和选择Saveas菜单时相同的Saveas对话框。里面可以保存的数据类型和可以打开的几乎一样多,选择合适的类型,确定就是了。 Save命令的快捷键为^S,如果你曾经领教过Windows死机的巨大潜力,那么你一定会同意习惯性的随手按^S至少不能算是一个坏习惯。如果你准备将数据存为SPSS以外的其他类型,要注意有些设置可能会丢失,如标签和缺失值等。尤其是缺失值,如果想存的数据格式不支持缺失值,那你的数据可能会变的面目全非。2.1.4 File菜单中的其他条目【DispDataInfo】该菜单项用于显示数据的基本信息,选择它后会弹出非常类似于打开文件的一个对话框用于选择数据文件,选择好后按OK,系统就会在结果窗口中列出所选数据的基本情况,如建立时间、标签设置、记录数、变量设置等。 【ApplyDataDictionary】即使用数据字典,该功能使你可以直接在新数据集中套用以前定义好的变量设置(格式、标签等,但不包括数据类型),举个例子吧:请打开Li1_1.sav文件,将变量x的长度从8改为4,标签删掉,然后选择菜单File==>ApplyDataDictionary,在文件对话框中选择Li1_1.sav并按OK(即将Li1_1.sav的变量设置按相同变量名一一套用在现在的数据集上),怎么样?一切都变回去了吧。【CacheData】建立数据缓冲区。以前SPSS每执行一条命令都会重新读取所需的数据,如果是从远程用SQL调用数据库,这会非常的费时。现在使用CacheData,可以将数据全部读入暂存盘,建立活动数据的缓冲区。大大加快处理速度。不过我特意试了一下,如果是处理本机数据的话,该命令对速度的提升不是非常明显:(。【Print和PrintPreview】这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来,其中PrintPreview是新增加的,使用上和WPS2000的打印预览非常相似(其实用的是同样的程序),不过和SPSS结果的打印程序一样,用SPSS直接打印数据非常的浪费纸张,用不用你自己决定吧。【StopProcessor】用于停止执行当前的SPSS命令。由于SPSS处理速度非常的慢,如果你正在对一个大型的数据执行统计命令,等了半天都没有结束,此时你的另一半约你逛街的时间又要到了,可是你的结果还没有存,执行命令时又存不了,怎么办呢?试试这个命令吧。 并非所有的命令都可以喊停的,许多数据库操作命令(计算变量,合并等)好象就停不了。§2.2 编辑数据文件在SPSS中,数据文件的编辑、整理等功能被集中在了Data和Transform两个菜单项中,这两个菜单的内容如下所示: Data菜单项Transform菜单项下面我们将根据其功能来分别讲述。2.2.1 定义新变量2.2.1.1 直接定义新变量大多数情况下我们需要从头定义变量,在SPSS10.0中,定义变量的操作界面和FoxPro等数据库非常相似,只需单击左下方的VariableView标签就可以切换到变量定义界面开始定义新变量。如Li1_1.sav的变量定义如下所示:以变量x为例:变量名为x,类型为Numeric,宽度为4,小数位数2位(因小数点还要占一位,故整数位只有一位),变量标签位为“血磷值”。右侧在图中未能看到的依次为Values,用于定义具体变量值的标签;Missing,用于定义变量缺失值;Colomns,定义显示列宽;Align,定义显示对齐方式;Measure,定义变量类型是连续、有序分类还是无序分类。使用该窗口,我们可以一次定义许多新变量,不会象老版本那样一个一个的定义了。由于SPSS是英文软件,变量名采用中文会有潜在的冲突(100%的兼容性是不存在的,典型的例子就是微软公司的产品)。 对于喜欢搞点花样的用户,这里有必要介绍一下SPSS中标签和缺失值的定义方法:标签 和老版本不同,现在变量标签和变量值标签被分开设置,变量标签就在Label框中直接输入,变量值标签则在它右侧的Value框定义。以group为例,单击Value框右半部的省略号,会弹出变量值标签对话框如下:上部的两个文本框分别为变量值输入框和变量值标签输入框,分别在其中输入“1”和“克山病患者”,此时下方的Add钮变黑,单击它,该变量值标签就会被加入下方的标签框内。与此类似定义变量值“2”为“健康人”,最后按OK,变量值标签就设置完成。此时你做任何分析,在结果中都有相应的标签出现。如果你现在就想看效果,切换回DataView界面,然后选择菜单View==>ValueLabels,怎么样,看到了吗?缺失值 单击missing框右侧的省略号,会弹出缺失值对话框如下:界面上有一列三个单选钮,默认值为最上方的“无缺失值”;第二项为“不连续缺失值保疃嗫梢远ㄒ?个值;最后一项为“缺失值范围加可选的一个缺失值”,文如其意,不用我多解释了吧。2.2.1.2 从原有变量计算新变量从头定义变量的情况多数在建立数据集时出现。但是,当数据集已经建立,需要整理、转换变量时,碰到的更多情况是需要根据某种条件从原有变量计算新变量。下面我们将按菜单条目的顺序依次讲解他们的功能。但是,首先我们需要了解一下所用的对话框界面的情况。 【SPSS对话框元素介绍】下面是我们在第一章曾经见过的两样本t检验对话框:这是一个非常典型的SPSS对话框。它包含了许多具有SPSS特色的对话框元素:o对话框左侧为候选变量列表框,里面列出了可被该对话框使用的变量;o右上方为TestVariables框,可将变量选入其中;注意在两个框的中间用“”相连,这是变量移动按钮,其方向表明是将变量从那个框移动到哪个框,上图中我们选中了变量group,两个移动按钮均变黑并向右指,表明变量group可以移动到他们右侧的两个框里去,改变当前框(在其他两个框里单击),移动按钮就会转向、变灰等以表明不同的意思(墙头草一个,可别小看这个功能,我想用VB实现这个功能,也是费了些工夫才把它搞定了);o右侧为一排五个按钮,分别是确定、粘贴、重置、取消和帮助。这五个兄弟也是几乎永远一起出现的,另外四个大家都比较熟悉了,重置(Reset)按钮用于取消对话框内已做的选择,恢复到默认的状态;o最下方有个Options按钮,用于设置专门用于该对话框的选项;oOK、Paste两个按钮为灰色,表明所需条件尚未满足,该按钮暂不可用。同理,GroupingVariable框下方的DefineGroups按钮为灰色显示,也表明暂不可用。【ComputeVariable对话框】例3.2 在li1_1.sav中建立新变量temp,令其值当血磷值大于1时为2,否则为1。解:这里需要用到ComputeVariable对话框,外加一点技巧。首先给变量temp均赋值为1,然后将血磷值大于1的记录其temp变量值改为2即可。选择菜单Transform==>Compute,弹出ComputeVariable对话框如下: 左上角为需要计算的变量名,在其中键入“temp”,此时“Type&Lable”按钮就会变黑,喜欢精确的朋友可以在这里对temp进行详细的定义,但如果你和我一样非常懒,就可以对它视而不见(不要生气,聪明人大多都非常懒:));左下方为候选变量列表,现在还用不着;中部为类似计算器的软键盘,可以用鼠标按键输入数字和符号,这里我们直接输入“1”,输入的内容回立刻在右上方的数值表达式窗口中出现;软键盘右侧为函数窗口,可以在这里找到并使用所需的SPSS函数;这次也用不到。好,现在“OK”按钮已经变黑,单击他,系统就会自动生成一个新变量temp,并且取值均为1。软键盘上几个奇奇怪怪的符号的含义如下:~=&|**~不等号,等价于<>逻辑符号AND逻辑符号OR乘方,相当于函数EXP()逻辑符号NOT在函数窗口中选中某个函数并单击右键,系统就会弹出该函数的用法说明。函数主要是和变量名组合起来使用的,比如说ABS(x)就是取变量x的绝对值。好,现在开始进行第二步,再次选择菜单Transform==>Compute,系统也再次弹出这个对话框--等等!注意到了吗?该对话框自动记住了你上次输入的内容,几乎所有SPSS的对话框都有这个特性,这会大大方便我们的使用。好,将数值表达式窗口中的1改为2,然后单击中下部的“If”按钮,系统弹出记录选择对话框如下: 不需要太多解释,大部分内容都是前面见过的。由于我们这里不是对所有记录做变换,因此选中第二个单选钮“Includeifcasestatisfiesconfition:”,此时下方的所有窗口变亮,表明现在可用;而“Continue”按钮变灰,表明当前还没有提供所需的信息,好,我们就来提供,在左侧选中血磷值(x),然后单击“”,x就被引入了右侧的变量框,任你用键盘或者用鼠标,总之将下面这个算式补充完:x>1。现在可见“Continue”按钮再度变黑。在它又变灰之前赶快单击它(开个玩笑),系统回到ComputeVariable对话框,请注意If按钮右侧的变化:x>2。如果你做的结果不一样,请重来一遍。现在单击“OK”按钮,由于我们要替换变量值,系统会弹出一个确认对话框,确认替换,马上你就会看到,我们已经把这道题做完了。【Count对话框】Count对话框用于计算某个值或某些值在某个变量的取值中是否出现(好象有点拗口),比如我们想看看有哪些记录的血磷值在2~3之间,选择菜单Transform==>Count,系统弹出Count对话框如下: TargetVariable框中用于指定记录变量值是否出现的变量名,在这里输入temp2;选中血磷值(x),将其选入Variables窗口,此时“DefineValues”按钮变黑,单击它,系统弹出变量值定义窗口如下:左半部为变量值定义窗口,可以定义某个值、系统缺失值、系统或用户定义缺失值、变量值范围、小于某值或大于某值。我们这里是第四种情况:选择Range,在through两侧分别键入2、3,然后单击已变黑的“Add”按钮,“2thru3”就会被加入“ValuestoCount”框内。然后单击“Continue”,再单击Count对话框的“OK”,可以看到系统自动生成变量temp2,其中10、11号记录因血磷值介于2和3之间,temp2取值为1,其余的记录temp2取值均为0。 SOS,SOS,请大家千万注意,Count对话框有一个潜在的bugs,当你需要计算同时满足两个变量取值条件的记录数有多少时,直接用该对话框会得出完全错误的结果。这里有一点技巧,需要对对话框生成的指令加以修改,至于怎么修改嘛,我们将在Syntax(语法)窗口使用详解一章中讲述:)。【Recode对话框】Recode对话框用于从原变量值按照某种一一对应的关系生成新变量值,可以将新值赋给原变量,也可以生成一个新变量。例2.3 在Li1_1.sav中生成新变量temp3,当血磷值小于1时取值为0,1~2时取值为10,大于2时取值为20。解:选择菜单Transform==>Record==>IntoDifferentVariables,Recode对话框如下:将血磷值(x)选入InputVariable->OutputVariable框,此时OutputVariable框变黑,在其中键入新变量名temp3并单击Change,可见原来的x->?变成了x->temp3。现在单击“OldandNewValues”,系统弹出变量值定义对话框如下: 许多东西和前面类似,不再重复。按照题目的要求,选择Range:Lowestthrough,在右侧框中键入1,然后在右上方的Value右侧框中键入对应的新变量值0,此时下方Add键变黑,单击它,Old->New框中就会加入Lowestthru1->0,按照类似的方法依次加入另两条转换规则,最终Old->New框中共有Lowestthru1->0、1thru2->10、Else->20三条,现在单击Continue,再单击OK,系统就会按要求生成新变量temp3。哎呀不得了,图片太多了,虽然这样非常直观,但下载速度太慢了。等大家对基本界面操作熟悉了后,我们将对比较简单的对话框试着对操作用文字的方式描述,比如上面的操作我们将用文字表达为:1.OutputVariable框:选入x2.OutputVariableName框:键入temp3:单击Change钮3.选中x->temp3:单击OldandNewValues钮:4. Range:Lowestthrough单选钮:键入1:NewValueValue单选钮:键入0:单击Add钮5. Range:through单选钮:两侧分别键入1、2:NewValueValue单选钮:键入10:单击Add钮6. Range:Allothervalues单选钮:NewValueValue单选钮:键入20:单击Add钮7. 单击Continue8.单击OK怎么样,还能理解吧。【CategorizeVariables对话框】CategorizeVariables对话框用于将连续性变量自动按要求分成等间距的几类。其界面非常简单,许多东西都是我们所熟悉的,唯一特别的是右下方的numberof categories框,用于输入变量的等级数,默认为4,比如我们希望将血磷值按大小分成5个等级,先将血磷值选入CreateCategories框,然后将下面的4改为5,单击OK,就会看到系统产生了一个新变量nx(即numberofx之意),其取值就对应了血磷值相应的5个等级(1~5)。重复一下,具体操作步骤为:1.CreateCategories框:选入x2.Numberofcategories框:53.OK【RankCases对话框】例2.4 请分组计算血磷值的秩和。解:选择菜单Transform==>RankCases,弹出RankCases对话框如下:将血磷值选入Variable框,分组变量选入By框,单击OK即可。系统会建立一个新变量rx(即原变量名前加r表示Rank之意),其取值为x分组的秩次。解释一下RankCases对话框的其他几个零件:o左下角的AssignRank1to框架用于选择将秩次1赋给最小值还是最大值;o中下部的Displaysummarytables复选框用于确定是否在结果窗口内输出结果报表;oRankTypes钮用于定义秩次类型,有Rank(秩分数)、Savage评分(新变量值按指数分布)、Fractionalrank(新变量值是秩分数除以非缺失值观测量的权重之和)、Fractionalrank%(新变量值是秩分数除以非缺失值观测量数乘100)、Sumofcase weights(新变量值是各观测量的权重之和)、Ntiles(新变量值是按所选变量的百分位数分组的组序号),默认值为Rank。单击More按钮,还会有更多的设置,这里就不再讲了。oTies钮用于定义对相同值观测量的处理方式,可以是取平均秩次、最小值、最大值或当作一个记录处理,默认值为取平均秩次。【AutomaticRecord对话框】该对话框用于按原变量值的大小生成新变量,变量值就是原值的大小次序,功能和RankCases对话框重复(等价于相同值观测量当作一个记录处理的情况)。【CreateTimeSeries对话框】用于自动生成时间序列变量,由于太专业,这里不做过多解释。【ReplaceMissingValue对话框】用于填充缺失值,结果存入一个新变量。填充方法有:序列的均数、相邻若干点的均数、相邻若干点的中位数、线性内插、线性外延,默认值为序列的均数。2.2.2 数据的录入2.2.2.1 直接录入我想直接录入的问题就不用多讲了吧,直接敲就是了!2.2.2.2 数据录入技巧和其他常用统计软件相比,SPSS数据界面最大的优势就是支持鼠标的拖放操作,以及拷贝粘贴等命令,下面的数据录入技巧就是对这些功能的利用。【连续多个相同值的输入】如前面group变量有连续多个1,如果直接输入,可以在第一格内输入1并回车,然后回到刚才的单元格并单击右键,选择copy,最后用拖放方式选中所有应输入1的单元格,单击右键并选择paste,所有选中的单元格就会都被刚才拷贝的1填充。【将EXCEL数据直接引入SPSS】Excel已经打开原数据,并且数据量较少的时候,可以直接用拷贝粘贴的方法将数据引入SPSS:先在EXCEL中选中所有的数据(不包括变量名),然后选择拷贝命令;然后切换到SPSS,最好使行1列1单元格成为当前单元格,然后执行粘贴命令,数据就会全部转入SPSS,再定义相应的变量即可。2.3 进一步整理数据文件--Data菜单 在许多情况下,我们需要先对数据进行一些整理(如分组、合并、加权等)才能将其用于最终的统计分析。这些功能基本上都集中在Data菜单项中,下面我们就对这些对话框做逐一介绍。2.3.1用于数据管理的菜单项【SortCases对话框】例2.5 对数据集li1_1.sav按group升序,x降序的次序排列。解:选择菜单Data==>SortCases,系统弹出SortCases对话框,该对话框并不复杂,其中比较特殊的是下方的SortOrder单选钮,有升序和降序两种选择。请注意,该单选钮是和上方的SortBy框一起使用的,具体方法如下:1.确认升序单选钮被选择,将Group选入SortBy框;2.选择降序单选钮,将x选入SortBy框。请注意:group和x后面分别跟着Ascending和Descending,表明前者是按升序、后者按降序排列;由于Group在前,因此排序时以Group优先。【Transepose对话框】该对话框用于对数据进行行列转置,可以在原数据文件中指定一个变量记录转置后的变量名。原变量名则自动保存在系统产生的名为case_lbl的字符变量中。该对话框也非常简单,左侧为候选变量框;右上方为Variable框,用于选入需要转置的变量,一般应选入除名称变量外的所有其他变量,如果有变量未选入,则转置时会被自动丢弃;右下方为NameVariable框,用于指定原数据文件中记录转置后变量名的字符变量,但不是必需的,此时系统会将新变量自动按var001、var002...的顺序命名。【MergeFiles对话框】用于合并数据文件,实际上包括了两个对话框,分别对应了两种合并方式: 1.从外部数据文件中增加记录到当前数据文件中,称为纵向合并,用AddCases对话框完成,相互合并的数据文件中应该有相同的变量。选择菜单Data==>MergeFiles==>AddCases,系统首先弹出打开数据文件对话框,选中需要添加的数据文件并按OK,系统才弹出AddCases对话框,左侧显示的是新、老数据文件中不匹配的变量名,右侧显示的是已经匹配的变量名。可以用Rename按钮对不匹配变量改名(先选中)或用鼠标强行匹配(即先按Ctrl键选中匹配的两个变量再单击Pair钮)。右下方的Indicatecasesourceasvariable复选框用于定义一个新变量以区分哪些记录是后来添加的。选择停当后单击OK,该操作就完成了。实际上右侧显示的是将要包括在合并后数据集中的变量,如果有哪个你不需要,把它弄到左侧框中即可。2.从外部数据文件增加变量到当前数据文件,称为横向合并,用AddVariable对话框完成,相互合并的数据文件中应包含同样的记录。选择菜单Data==>MergeFiles==>AddVariable对话框,系统同样先弹出打开数据文件对话框,单击OK后弹出和前面相似的AddVariable对话框。按需选择即可。【Aggregate对话框】用于对数据进行分类汇总,所谓分类汇总就是按指定的分类变量对观测值进行分组,对每组记录的各变量值求指定的描述统计量,结果可以存入新数据文件,也可以替换当前数据文件。上图中各个零件的含义如下:·BreakVariables框:用于选择分组变量;·AggregateVariables框:用于选择被汇总的变量;·Name&Label钮:用于定义新产生的汇总变量的名称和标签; ·Function钮:用于定义汇总函数,共有三组函数,以最常用的第一组为例,可选的函数有均数、同组的第一个观测值、最后一个观测值、同组记录数、标准差、最小值、和、最大值共8个;·SaveNumberofcasesinbreakgroupasvariable复选框:用于定义一个新变量以存储同组的记录数;·Createnewdatafile单选钮:定义一个新文件以存储汇总的结果,右侧的File钮用于具体文件名的定义,默认文件名为AGGR.sav;·Replaceworkingdatafile单选钮:用汇总的结果替换原来的数据。例2.6 计算Li1_1.sav中两组的血磷值标准差。解:该题完全可以用更简单的方法完成,这里只是演示一下汇总对话框的用法。1.BreakVariables框:Group2.AggregateVariables框:x3.Function钮:(Standarddeviation单选钮:Continue钮)4.Replaceworkingdatafile单选钮:选中5.OK【SplitFile对话框】用于将数据文件分组进行处理,该对话框我们在第一章时已经使用过了,这里再介绍一下各个对话框元素的用途:·Analyzeallcases单选框:和下面的两个单选框为一组,选中本框不拆分文件;·Comparegroups单选框:按所选变量拆分文件,各组分析结果紧挨在一起便于相互比较;·Organizeoutputbygroups单选框:按所选变量拆分文件,各组分析结果单独放置;· Groupsbasedon框:用于选择拆分数据文件的变量;·Sortthefilebygroupingvariables单选框:将数据按所用的拆分变量排序;·Fileisalreadysorted单选框:数据保持原状,不按所用的拆分变量排序。【SelectCases对话框】很多时候我们不需要分析全部的数据,而是按某种要求分析其中的一部分(比如只分析男性的身高、只对前200个数据进行分析以了解大概情况),这时使用SelectCases对话框可以大大简化工作。该对话框界面如下所示: 其中主要的对话框元素为:·Allcases单选钮:和下面的4个单选钮为一组,选中它则分析所有的记录;·Ifconditionissatisfied单选钮:只分析满足条件的记录;· If按钮:和If单选钮一起使用,单击后弹出If对话框;·Randomsampleofcases单选钮:从原数据中按某种条件抽样;· Sample按钮:和Random单选钮一起使用,可以设定按百分比抽取记录,或者精确设定从前若干个记录中抽取多少个记录;·Basedontimeorcaserange单选钮:基于记录序号来选择记录;· Range按钮:和Based单选钮一起使用,用于输入记录序号范围;·Usefiltervariable单选钮:使用筛选指示变量来选择记录,必需在下面选入一个筛选指示变量,该变量取值为非0的记录将被选中,进入以后的分析;·Filtered单选钮:和下面的Deleted单选钮为一组,表示未被选中的记录只是被隔离,这些记录的记录号会被加上斜杠以示区别;·Deleted单选钮:未被选中的记录将被删除,一般不要使用。当对数据集做出筛选后,所做的筛选将在以后的分析中一直有效,直到再次改变选择条件为止。同时在多数情况下,系统会自动产生一个名为filter_$的筛选指示变量,被选中的记录该变量取值为1,反之则为0。【WeightCases对话框】在默认情况下,每一行就是一条记录,这在多数情况下没有什么问题,但有时却非常麻烦,想想看如果你需要计算一个四格表卡方,有100例,如果每一行就是一条记录,你就需要输入100条记录!如果希望在计算过程中利用不同的变量对数据进行加权处理,就需要用到WeightCases对话框。该对话框的使用极为简单,界面上有两个单选钮,分别是不权重记录和用某变量权重记录,如果选择后者,则需要选中一个权重变量。 【Data菜单中的其余对话框】·Definedates对话框:可以自动生成时间变量。·InsertVariable命令:在当前列插入新变量。·Insertcases命令:在当前行插入新记录。·Gotocases对话框:到达指定记录号的记录,该命令在记录数极多时(1000条以上)非常有用。2.3.2 正交设计菜单项正交设计不包含在SPSS/BASE模块中,因此由于解密范围的问题,有的D版中不含该菜单项,不过我用的10.0版里是有的:)。以前我以为SPSS不能作正交设计,感谢网友edof@sh的提醒,经研究,在SPSS中可以直接进行正交设计,OrthogonalDesign子菜单项就是专门用于完成该任务的,具体做法用下面的例子说明如下:例2.7做A、B两个因素的正交设计,A因素有三个水平,B因素有两个水平。解:选择Data-->OrthogonalDesign-->generate,弹出的就是正交设计窗口,操作如下:1.Factorname框:输入A;2.单击ADD钮;3.确定变量A被选中,单击Definevalue钮;4. Value列:头三行分别输入1、2和3,代表变量A的三个水平;5. 单击continue钮;6.Factorname框:输入B;7.单击ADD钮;8.确定变量B被选中,单击Definevalue钮;9. Value列:头两行分别输入1、2,代表变量B的两个水平;10. 单击continue钮;11.单击OK在第10步定义完后,对话框应如下图所示: 在其他没有用到的选择项中,各种LABELS当然适用于定义相应的各种标签的;DataFiles单选框组用来定义产生的数据文件是存为制定的文件名,还是直接替换当前工作文件;而DefineValue对话框中的Autofit框可以自动填充从1到你输入的那个数值这么多个水平的定义,特别适合我这种懒人。这里我们直接替换当前工作文件,在这个自动产生的正交设计数据集中,前两个变量就是要分析的A和B,各个水平已经按正交设计的要求排列好了。后面的status_和card_变量是系统产生的LOG变量,可以不管它。现在你再建立一个结果变量,输入实验结果,就可以进行正交设计的分析了。
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处