欢迎来到天天文库
浏览记录
ID:52066459
大小:451.50 KB
页数:25页
时间:2020-03-31
《《SPSS数据的预处理》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、SPSS数据的预处理第三章SPSS数据的预处理3.1数据的排序3.2变量计算3.3数据选取3.4计数3.5分类汇总3.6数据分组3.7数据预处理的其他功能3.1数据的排序根据某些变量值重新排列各观测量在数据文件中出现的先后顺序,如:按高矮排队、按成绩排名等。数据排序的目的:数据排序在数据分析过程中有很重要的作用:便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等。找到数据的最大值和最小值,进而可以计算出数据的全距(极差Range),初步把握和比较数据的离散程度。快捷的发现数据的异常值,为进一步明确它们是否对分析产生重要影响等提供帮助。数据排序步骤1。打
2、开数据文件2。选择Data->SortCasea.选择Sortby变量b.升序或降序3。选择排序变量4。选择排序方式5。击OK数据排序实验数据排序的应用举例以“住房状况调查.sav”为例,通过数据排序功能分析本市户口和外地户口家庭的住房面积情况。结果解释:本市户口家庭住房面积的最小值为6平方米,最大值为300平方米;外地户口家庭住房面积的最小值为7平方米,最大值为168平方米。可见,在最小值上,本市户口和外地户口家庭差距很小,但在最大值上却有较大差距,而且从全距角度看,本市户口不同家庭间的住房面积差距比外地户口要大许多。数据排序实验实验内容:案例3-1。打开数据
3、文件“3.1职工数据.sav”,以职称为主排序变量的降序,基本工资为第二排序变量的升序进行多重排序。详细写出SPSS具体操作过程及分析结论。3.2变量计算变量计算目的数据的转换处理对数据的原有分布状态进行转换几个概念SPSS算术表达式SPSS条件表达式SPSS函数步骤1。读数据文件2。选Transform->compute3。确定目标变量4。确定目标变量的数值表达式5。按OK例:现有某班的5门功课期末考试成绩。为了进一步的分析,需要先对数据进行整理,要求算出5门功课的总分、平均分、加权总分(语文、数学的权重为1.2,物理、化学的权重为1.0,生物的权重为0.7)
4、。1、建立数据文件“3.2test.sav”,变量名为no(学号)、chinese(语文)、math(数学)、physics(物理)、chemist(化学)、biology(生物)。2、选择[Transform]→[Compute],打开ComputingVariable(计算变量)主对话框,见图。3、在TargetVariable(目标变量)框中,输入变量名score。4、单击[Type&Label],打开ComputeVariable:TypeandLabel(计算变量:类型与标识)对话框,见图。在此可设定目标变量的变量标识(Label)与变量类型(Type
5、)。Label(变量标识)(1)Label(标识),由用户自行录入标识名称,本例为“总分”。(2)Useexpressionaslabel(使用表达式作为标识)。Type(变量类型),可选择Numeric(数值型)或String(字符串)。5、在NumericExpression(数值表达式)框输入表达式:SUM(chinese,math,physics,chemist,biology)或者chinese+math+physics+chemist+biology6、单击[OK],即可生成一个新变量(score)。同样的操作,我们还可计算出平均分与加权总分,有关设
6、置如下:变量1:平均分目标变量1:Mean标识1:平均分数值表达式1:MEAN(chinese,math,physics,chemist,biology)变量2:加权总分目标变量2:W_score标识2:加权总分数值表达式2:chinese*1.2+math*1.2+physics+chemist+biology*0.7例:为了便于对某市儿童死亡资料(age_com.sav)进行进一步的分析,先根据出生日期(bdate)及死亡日期(ddate)对该数据按如下要求进行分组。(见下一页表)年龄的分组要求及值标识编码分组要求(值标识)分组条件1早期新生儿死亡日龄<7天
7、2晚期新生儿死亡日龄≥7天且<28天3大于28天婴儿死亡日龄≥28天且年龄<1岁41-4岁儿童死亡年龄≥1岁且<5岁55岁以上儿童死亡年龄≥5岁打开文件“3.2age_com.sav”。选择选择[Transform]→[Compute],打开ComputingVariable(计算变量)主对话框。在TargetVariable(目标变量)框中,输入变量名group。单击[Type&Label],打开ComputeVariable:TypeandLabel(计算变量:类型与标识)对话框,在此对话框中设定变量标识(Label)为死亡分组。在NumericExpres
8、sion(数值表达式)框
此文档下载收益归作者所有