欢迎来到天天文库
浏览记录
ID:11663347
大小:261.50 KB
页数:13页
时间:2018-07-13
《第三章 transform——data 菜单详解》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第三章Transform/Data菜单详解本章主要介绍数据管理的基本内容,包括数据的合并、拆分、转置、编码等内容,是进行正式统计分析前的重要一步。Transform菜单主要针对数据中变量的变换,如根据已知变量产生一个新的变量,Data菜单主要针对数据库的维护,如数据文件的合并、拆分、汇总等。3.1SPSS对话框元素介绍下面所介绍的是在SPSS所有的统计分析中都会出现的典型的对话框,了解对话框的基本结构有助于更好的掌握SPSS。一、一级对话框元素介绍1、候选变量列表框2、选入变量列表框3、变量移动钮4、五个标准按钮5、其他按钮二、二级对话框元素介绍1、单选框2、复选框3、下拉列表
2、框4、文本框以回归分析(Analyze——Regression)三、对话框常用操作技巧(略)见书P303.2Transform菜单详解本菜单功能丰富,主要针对数据文件中的变量进行各种转换。一、Compute过程(重点掌握)Compute过程是Transform菜单中最常用的一个过程,功能是用于给变量赋值。例1:见书P31(演示操作过程)方法一:第一步:产生一个新变量“new”,并给该变量赋值1;第二步:对该新变量进行修改,修改条件:当血磷值超过1的时候,令“new”的取值为2方法二:用逻辑函数any例2:打开cars.sav文件,对产地为欧洲的汽车的数据进行转换,将“马力”增加
3、20函数介绍:1、Arithmetic函数——数学函数Abs(?)——返回变量的绝对值Arsin(?)——返回变量的反三角函数值Mod(?,?)——返回数值表达式除以模数后的余数,要求模数不能为0Rnd(?)——返回数值表达式四舍五入后得到的整数值Trunc(?)——返回数值表达式截尾以后得到的整数值2、CDF返回累积分布函数的累积概率值如:CDF.Normal(X1,0,1)=X2X1X2-20.02-10.1600.510.8420.983、日期和时间函数(略)4、随机变量函数(Randomnumbers)RV.Normal(mean,stddev)——返回来自指定均值和标
4、准离差的正态分布的随机数RV.EXP(shape)——返回服从指定参数的指数分布随机数RV.Possion(mean)——返回服从指定均值的泊松分布的随机数RV.Uniform(min,max)——返回指定最小值和最大值的均匀分布的随机数(1)产生一系列随机数(操作讲解)(2)应用:如有100个case,想打乱它们的顺序,该如何解决?方法:首先产生一个均匀分布的随机数,然后按随机数进行排序后即可。如:从编号为1~300的灯泡中随机抽20个进行检验,如何实现?方法:运用计算机产生20个1到600间的随机数,取出他们对应的灯泡进行检验即可。5、统计函数CFVAR(标准离差/均值);
5、MAX/最大值;MIN/最小值;MEAN/均值;SD/标准差;SUM/求和;VARIANCE/方差例:运用产生随机数的方法产生一个数据文件,文件命名为chengji.sav,包含学号(x1),语文(x2)、数学(x3)、英语(x4)四个变量名,计算各门功课的平均成绩/总分。6、逻辑函数ANY7、字符串函数8、转换函数converse主要用于字符型变量与数值型变量的转换二、Count过程该过程用于标示某个值或某些值在某个变量的取值中是否出现。标示:SPSS会自动用数字1来标注满足所需条件的记录。例1:见书P32如果想知道哪些记录的血磷脂在2~3之间,则可以通过count过程实现。
6、(操作)例2:在cars.sav文件中标出美国产的汽车马力在135以下的记录注意:Count在标示数据的过程中,不能对同时满足多个取值条件的记录进行标示,只能对满足某一个条件的变量进行标示。三、Recode过程该过程用于将原变量按照某种一一对应的关系生成新变量,可以将新值赋给原变量也可以生成一个新变量。例1:见书P33(操作)例2:打开cars.sav,将美国产的汽车进行编码,马力在100以下的取值为0,马力在100~200的取值为10,马力在200以上的取值20,生成新变量temp四、RankCases过程该过程是专门履行排次序的功能的。因为在非参数统计中,经常要用到秩次这个
7、统计量。例:请分组计算血磷脂的秩次。五、其他菜单1、RandomNumberSeed该过程用于随机种子的设定,可以保证随机数重复出现操作:固定随机种子,并产生20个随机数不固定随机种子,并产生20个随机数2、AutomaticRecode(与Rankcase过程相似,略)3、ReplaceMissingValue与CreateTimesSeries均属于针对于时间序列数据,此处略。3.3Data菜单详解Transform倾向于对变量进行处理操作,而Data倾向于对整个数据文件进行处理操作该菜
此文档下载收益归作者所有