欢迎来到天天文库
浏览记录
ID:48079553
大小:819.00 KB
页数:50页
时间:2020-01-14
《二 SPSS数据文件的建立和管理.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二章SPSS数据文件的建立与管理SPSS数据文件SPSS数据的结构和定义方法SPSS数据的录入和编辑SPSS数据的保存读取其他格式的数据文件SPSS数据文件的合并8/30/20212.1SPSS数据文件2.1.1SPSS数据文件的特点:SPSS是一个有别于其他文件的特殊格式的文件,SPSS数据文件是一种有结构的数据文件,它由数据结构和内容两部分组成,其中的数据结构记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等必要信息,数据的内容才是那些待分析的具体数据
2、。基于上述特点,建立SPSS数据文件时应完成两项任务,即描述数据的结构和录入编辑数据。数据编辑窗口中的一行称为一个个案或记录(Case),所有个案组成SPSS数据文件的内容。数据编辑窗口的一列称为一个变量(Variable),每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标志。SPSS数据文件的结构就是对每个变量及相关特征的描述。2.1.2SPSS数据的组织方式(1)原始数据的组织方式(2)频数数据的组织方式例:职称年龄段35岁以下(1)36-49岁(2)50岁以上(3)教授(1)0158副
3、教授(2)10202讲师(3)20101助教(4)3520频数数据的组织方式职称年龄段人数1101215138211022202323120321033141354224302.2SPSS数据的结构和定义方法SPSS数据的结构是对SPSS每列变量及其相关属性的描述,主要包括变量名、数据类型、变量宽度、变量名标签、变量值标签、显示宽度、缺失值、对齐方式、度量尺度等信息。变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下:1.首字符应以英文字母开头,后面可以跟除了!
4、、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。3.SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。变量名(Variablename)数据类型(Type)数据类型是指每个变量取值的类型。SPSS
5、中有三种基本数据类型:数值型、字符型和日期型。数值型(1)标准型(Numeric)(2)科学记数法型(ScientificNotation)(3)逗号型(Comma)(4)圆点型(Dot)(5)美元符号型(Dollar)(6)用户自定义型(CustomCurrency)字符型(String)日期型(Date)数值型数值型是SPSS最常用的数据类型,通常由阿拉伯数字和其它特殊符号等组成。其中的标准型(numeric)是SPSS默认的数据类型,默认的显示宽度为8位,包括正负符号位、小数点和小数位在内,小数位默认为2位。
6、如果数据的实际宽度大于8位,spss将自动按照科学计数法显示,数据的显示并不影响数据的存储,也不影响数据的计算。字符型(String)字符型也是SPSS较常用的数据类型,由一个字符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。字符型数据的默认显示宽度为8个字符,不能够进行算术运算,并区分大小写字母。字符型数据在SPSS命令处理过程中应用一对双引号括起来,但在输入数据时不应输入双引号,否则双引号将会作为字符型数据的一部分。日期型(Data)日期型数据用来表示日期或者时间,如生日、成立日期等变量可以定义为
7、日期型数据。显示格式:dd-mmm-yyyy;mm/dd/yyyy。每种类型的变量都有自己的变量宽度、小数位和显示宽度,其中变量宽度是变量允许的最大字符位数,列宽度是数据编辑窗口中显示每列的字符位数。通常这两个宽度是一致的。变量宽度(Width)、显示宽度(Columns)变量名标签(Variablelabel)变量名标签是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计分析结果的可读性。变量名标签可用中文,总长度可达120个字符,但在统计分析结果的显示中一般不能显示如此长的变量名标签信息。变量值标签(
8、Valuelabel)变量值标签是对变量取值含义的解释说明信息,对于品质型数据尤为重要,比如1代表男性,2代表女性,它不但明确了数据的含义,也增强了最后统计分析结果的可读性,变量值标签可以用中文。缺失数据(Missingvalues)数据中存在明显错误或明显不合理的数据或漏填数据项时统计学上称为不完全数据或缺失数据。数据中如果存在缺失数据,分析时通常不能直接
此文档下载收益归作者所有