欢迎来到天天文库
浏览记录
ID:38563390
大小:35.00 KB
页数:4页
时间:2019-06-15
《SPSS操作指导new》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、SPSS操作指导社会统计学软件包(SPSS)20世纪60年代由美国斯坦福大学的3位研究生研制开发,使国际上最有影响力的统计软件之一,广泛用于社会学、经济学、生物学、教育学、心理学等各个领域。一、SPSS数据文件管理1、建立一个数据文件菜单“文件”——“新建”——“数据”;(1)单击“变量视图”。标签:变量名不能超过8个字符,所以需要输入相应变量的文字解释说明。值:一般适用于定类变量和定序变量。缺失:定义缺失值没有缺失值,系统默认选项。离散缺失值,制定3个数值为缺失值。缺失值的范围。列:定义列宽测量:尺度指定距和定比数据,用于代表连续数据;有序代表定序数据;名义代表定类数据
2、。(2)单击“数据视图”进行数据的直接录入。注意:开放题和简单单选题录入相似。多选题的录入比较复杂。多选题又称为多重应答,是社会调查和市场调研中极为常见的一种数据记录类型。录入时可以采用两类:多重二分法、多重分类法。多重二分法是指在编码的时候,对应每一个选型都要定义一个变量,有几个选项就有几个变量,这些变量均为二分类,它们各自代表对一个选项的选择结果。如1代表选择,0代表未选。多重分类法是利用多个变量来对一个多选题的答案进行定义,这些变量须为数值型变量,利用值标签将答案标出,所有变量采用一套值标签。适合于选项较多的情况。2、读取外部数据一般使用EXCEL数据。菜单“文件”
3、——“打开”——“数据”,调出打开文件对话框,在文件类型下拉列表中选择EXCEL类型。二、数据整理数据整理的功能主要集中在“数据”和“转换”两个主菜单下。1、数据“数据”——“个案排序”。“数据”——“转置”。“数据”——“选择个案”。“数据”——“分类汇总”;分组变量一般是离散变量,而汇总变量一般是连续变量。要同时计算一个变量的两个统计量时需要将该变量移入两次汇总变量。“数据”——“合并文件”;添加个案是指纵向合并样本量;添加变量是指横向合并变量。未匹配变量中变量为工作数据文件中的变量,+为外部数据文件中的变量。指定变量来源可以通过0-1变量来实现指明。变量名不同但实质
4、相同的变量可以通过Pair键实现合并。添加变量时排除变量名不会出现在新工作表中,系统默认的排除变量是外部文件中与工作文件中重名的变量。注意选择一个关键变量进行合并。“数据”——“拆分文件”。2、转换“转换”——“计算”。目标变量名已经存在则用新变量替换旧变量。可以进行条件计算。“转换”——“重新编码”。分为成相同变量和成不同变量两种。“值”用于离散值的重新编码。3、数据分组两种方法:利用重新编码进行是很好的一种方法;利用“转换”——“分类变量”进行。4、数据标准化“分析”——“描述统计”——“描述”。三、统计描述1、频数分析频数分析适用于离散变量,其功能是描述离散变量的分
5、布特征。菜单“分析”——“描述统计”——“频率”。其功能是产生原始数据的频数表,并能计算各种百分位数,还可以绘制相应的统计图。2、描述性统计量菜单“分析”——“描述统计”——“描述”。主要用于计算一般性的描述性统计量,不能绘制统计图。一般适用于对服从正态分布的连续性变量进行描述。3、探索性数据分析探索性数据分析,总的来说是基于数据稳健性和耐抗性的统计分析方法,其基本思路是在统计分析时尽量减少数据中存在的少量异常值对分析结果的影响。菜单“分析”——“描述统计”——“探索”。该过程可以计算许多描述统计量,给出各种统计图,并进行简单的参数估计。提供了三种非常重要的功能:(1)异
6、常值检查异常值是指观测数据中明显偏大或偏小的值。它们的存在有时会对统计模型的稳健性和正确性产生明显的影响。所以有必要找到这些异常值,并对其进行舍弃或修正。(2)分析正态性检验在统计分析中,许多方法都建立在数据服从正态分布的基础之上,因此,在建立模型之前对数据分布的正态性进行检验就显得非常重要。(3)方差齐性检验方差齐性检验就是检验各观测变量在控制变量不同水平下的方差是否相等。对于均值比较、方差分析等统计方法来说,检验方差是否符合齐性是一个非常关键的前提。“因变量列表”——待分析变量“因子列表”——分类变量,只有输入此变量才能进行方差齐性检验。“标注个案”——用变量标注观测
7、结果4、分类变量统计描述菜单“分析”——“描述统计”——“频率”。主要针对单个分类变量。菜单“分析”——“描述统计”——“交叉表”。主要分析两个或多个分类变量的联合描述,可以产生列联表。5、多选题的统计描述首先定义多重响应集,即“分析”——“多重响应”——“定义集合”,注意同一个多重响应集中的变量必须是同一类型(多重二分类或多重分类法)。“二分”指多重二分类编码,“计数值”表示哪个数值表示选中;“类别”指多重分类法编码,“全距”表示哪个范围的记录值将纳入分析。“名称”是要求对多选题的多重响应集命名。其次分析多重响应集,“分析”
此文档下载收益归作者所有