欢迎来到天天文库
浏览记录
ID:62167029
大小:253.00 KB
页数:12页
时间:2021-04-20
《实验一数据文件的建立与操作.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、实验一数据文件的建立使用SPSS进行统计分析时,首先要录入数据或者打开一个已经存在的数据文件,根据需要进行数据转换;然后选择合适的统计分析过程,选择统计分析所采用的方法和参数;最后分析SPSS输出的结果,并保存结果。一、数据文件的建立与保存I.新建数据文件启动SPSS后,出现的界面是数据编辑器窗口(如图1—4所示),图1-4SPSS界面示意图它的底部有两个标签:DataView(数据视图)和VariableView(变量视图),它们提供了一种类似于电子表格的方法,用以产生和编辑SPSS数据文件.[DataView]用于查看、录入和修改数据,[Variable
2、View]用来定义和修改变量的定义。如果使用过电子表格如MicrosoftExcel等,那么数据编辑窗口的许多功能应该已经熟悉。当你进入SPSS系统时,系统就已经生成了一个空数据文件,即你看到的空白的数据管理界面。你只要按自己的需要定义变量,输入数据然后存盘就是了。因此,建立SPSS数据文件时应完成两项任务:l描述SPSS的数据结构(在VariableView中完成)l录入编辑SPSS数据(在DataView中完成)1 直接定义新变量在SPSS10.0中,定义变量的操作界面和FoxPro等数据库非常相似,只需单击左下方的VariableView标签就可以切换
3、到变量定义界面开始定义新变量。1.1变量名(Name)l变量名的字符个数不多于8个;l首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。l变量名不区分大小写字母,允许汉字作为变量名,汉字总数不能超过4个,但可能会存在兼容的问题。lSPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等.1.2数据类型(Type)SPSS中有三种基本数据类型,分别为数值型、字符型和日期型。每种类型都有默认的宽度、小数位和列宽度。数值型数值型是SPSS最常用的数据类型,通常由阿拉伯数字(0~9)和其他特殊符号(如美元
4、符号,逗号,圆点)等组成。例如工资、年龄、成绩等变量都可以定义为数值型数据。有标准型、科学记数法,逗号型和圆点型等等.字符型字符型数据类型也是较为常用的数据类型,由一个字符串组成。如职工号码、姓名、地点等变量都可定义为字符型数据。字符型数据的默认显示宽度为8个字符位,不能够进行算术运算,并区分大小写字母。1.3变量名标签变量名标签是对变量名含义的进一步解释说明,它可增强变量名的可视性和统计分析结果的可读性。变量名标签可用中文.1.4变量值标签变量值标签是对变量取值含义的解释说明信息,对于品质型数据尤为重要。例如:对于性别变量,假设用数值1表示男,用数值2表示
5、女。那么,人们看到的数据仅仅是1和2这样的符号,通常很难弄清楚1代表男还是女,但如果为性别变量附加变量值标签,并给出1和2实际所指,则无疑会使数据含义非常清楚。1.1缺失数据l数据中存在明显错误或明显不合理的数据l数据中存在漏填的数据项SPSS中说明缺失数据的基本方法是指定用户缺失值。首先,在遗漏的数据处填入某个特定的标记数据。例如,将遗漏的年收入数据用特定的标记数据(如99999)来替代;然后,再指明这个特定的标记数据(如99999)或那些明显的失真数据(如年龄为213岁)等为缺失值,这样,在分析时,SPSS就能够将这些缺失值与正常的数据区分开来,并依据用
6、户指定的缺失值处理策略对其进行处理和分析.l对字符型或数值型变量,用户缺失值可以是1至3个特定的离散值(Discretemissingvalue)l对一个数值型变量,用户缺失值可以在一个连续的闭区间内并同时再附加一个区间以外的离散值(Rangeplusoneoptionaldiscrete)1.2度量尺度(Measure)统计学依据数据的度量尺度将数据划分为三大类,即定距型数据(Scale)、定序型数据(Ordinal)和定类型数据(Nominal)。定距型数据通常是指诸如身高、体重、血压等连续型数据,也包括诸如人数、商品件数等离散型数据;定序型数据具有内在
7、固有大小或高低顺序,但它又不同于定距型数据,一般可以用数值或字符表示.如职称变量可以有低级、中级和高级三个取值,可以分别用1,2,3等表示。年龄段变量可以有老、中、青三个取值,分别用A,B,C表示等。定类型数据没有内在固有大小或高低顺序,一般以数值或字符表示。如性别变量中的男、女取值,可以分别用1,2表示;民族变量中的各个民族,可以分别用“汉”、“回”、“满”,都不存在内部固有的大小或高低顺序,而只是一种名义上的指代。如Li1_1.sav的变量定义如下所示:以变量x为例:变量名为x,类型为Numeric,宽度为4,小数位数2位(因小数点还要占一位,故整数位只
8、有一位),变量标签位为“血磷值".右侧在图中未能看到
此文档下载收益归作者所有