欢迎来到天天文库
浏览记录
ID:9965870
大小:132.00 KB
页数:13页
时间:2018-05-17
《第三章 spss数据的预处理》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第三章SPSS数据的预处理为什么查进行预处理在数据文件建立之后,通常还需要对分析的数据进行必要的预加工处理,这是数据分析过程中必不可少的一个关键步骤。数据的预加工处理服务于数据分析和建模,主要包括以下几个问题:数据的排序变量计算数据选取计数分类汇总数据分组数据预处理的其他功能:转置、加权、数据拆分、缺失值处理、数据排秩、定义变量集。3.1数据的排序3.1.1数据排序的作用3.1.2数据排序的基本操作将观测量按照统计分析的具体要求进行合理的分类整理是数据文件整理的重要工作。仍以文件“研究生.sav”来说明,观测量分类整理的基本操作步骤如下:(1)执行Data→SortCa
2、ses(观测量分类)命令,打开SortCases对话框。(2)从源变量列表框中选择一个或几个分类变量,单击中间的箭头按钮将它们移入Sortby框中,不妨称移入该框的变量为By变量。选择By变量的意义是将按这个变量对观测量进行分类整理。如果选择了几个By变量,从上至下依次称为第一By变量、第二By变量等。分类整理将按每一个By变量层叠分类整理。例如,选择了两个分类变量,sex为第一By变量,score为第二By变量,在sex的每一个分类中观测值将按score分类。(3)在SortOrder栏中选择一种排序方式。如对某分类变量选择Ascending(升序),则在Sortby
3、框里该变量名之后用连线连接Ascending;如选择Descending(降序),该变量名连接Descending。各分类变量的排序方式可以不同。(4)以上选择确定后,单击OK,返回数据窗口,分类排序结果显示于数据窗口内。此外,对字符串变量按分类次序大写字母将优先于小写的同一字母。在我们引用的数本来有一个Order(序号)变量,它的值为自然数顺序。按照某些By变量分类后,要将文件恢复成原来的顺序,可以再用Order作为By变量执行观测量分类即可。如果文件缺少这样一个变量,经过分类的文件将不能恢复原状。SPSS的许多系统数据文件中都包含一个标志观测量序号的“id'’(单词
4、identity的头两个字母)变量,它就可以起到这个作用。3.2变量计算3.2.1变量计算的目的略3.2.2SPSS条件表达式条件表达式(If..)及其对话框的使用。有时候,仅仅需要对一些符合某些特定条件的自变量的观察值来进行计算。例如,在记录某年级3班和6班学生成绩的数据文件中,我们只需要了解3班女同学的学习情况,需要计算她们各门功课平均成绩,即需选择满足条件“sex=0&class=3”(即三班女学生)的观测值来计算。当条件表达式“sex=0”和“class=3”同时为真时,计算平均成绩。对使表达式为假的或缺失的观测量就不计算这个值,对应于这些观测量,新变量的值为系
5、统缺失值。在ComputeVariable对话框中单击If…按钮,打开IfCases条件对话框。对话框上方有两个单选项:●Includeallcases:对所有观测量计算新变量值,相当于不设条件,为系统默认的选项。●Includeifcasessatisfiescondition:对满足条件的观测量计算新变量值。此时,源变量清单栏、表达式栏、函数栏同时被激活,将条件表达式输入表达式框。单击Continue按钮对设定的条件表达式加以确认,返回ComputeVariable主对话框。条件表达式的建立规则是:条件表达式中至少要包括一个关系运算符,也可以使用逻辑运算符,并且可以
6、通过关系(或逻辑)运算符连接多个条件表达式。各项选择确认后,单击OK。系统将根据表达式和条件计算新变量的值,并且将其结果显示到数据窗口的工作文件中3.2.3SPSS算术表达式在Compute对话框中定义了计算表达式、目标函数,以及设置了计算条件后,单击主对话框的Paste按钮,系统随即打开Systax窗口,该窗口显示如下格式的命令语句。(1)未设置计算条件情况下,COMPUTE命令语句:COMPUTE变量名=计算表达式.EXECUTE.其中:●命令关键字COMPUTE。●变量名即定义的目标变量名,它既可以是在主对话框Taget框中新定义的变量名,也可以是当前工作文件中已
7、经存在的变量。●=等号。●计算表达式,表达式后接一个点“.”表示语句中止。计算表达式中的变量必须是工作文件中存在的变量。●“EXECUTE.”为执行语句。例如,假设表达式中的变量都是当前工作文件已经定义过的变量,则下列语句都是合法的COMPUTE命令:COMPUTEaverage=(math十physical十chemical)/3.COMPUTEaverage=mean(scoreltoscore5).COMPUTEage=2002—birthday.COMPUTEsales=quantity*price.COMPUTEpredict=
此文档下载收益归作者所有