CHAP3SPSS数据的预处理

CHAP3SPSS数据的预处理

ID:46937987

大小:309.81 KB

页数:19页

时间:2019-11-30

CHAP3SPSS数据的预处理_第1页
CHAP3SPSS数据的预处理_第2页
CHAP3SPSS数据的预处理_第3页
CHAP3SPSS数据的预处理_第4页
CHAP3SPSS数据的预处理_第5页
资源描述:

《CHAP3SPSS数据的预处理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章SPSS数据的预处理9/7/20213.1数据的排序菜单:【Data】-【SortCases】【Ascending】升序【Descending】降序例:职工数据.sav(P61)9/7/20213.2计算变量菜单:【Transform】-【Compute】三个概念:SPSS计算表达式;SPSS条件表达式;SPSS函数(P66-P71)例:1、职工数据.sav(P71)2、学生综合数据(依据各科成绩计算平均成绩)9/7/20213.3数据选取菜单:【Data】-【SelectCases】SPSS提供了以下几种数据选取方法:按指定条件选取(Ifc

2、onditionissatisfied)例:住房状况调查数据.sav(P75)随机选取(Randomsampleofcases)第一,近似选取(Approximately)第二,精确选取(Exactly)例:住房状况调查数据.sav(P75)选取某一区域内的样本(Basedontimeorcaserange)通过过滤变量选取(Usefiltervariable)9/7/20213.4计数菜单:【Transform】-【Count】Value(输入某个变量值作为计数对象)System-missing(以系统缺失值为计数对象)Systemoruser-

3、missing(以系统缺失值或用户缺失值为计数对象)Range(以给定闭区间为计数范围)nthroughm(以n,m闭区间为计数范围)Lowestthroughn(以区间≤n为计数范围)nthroughhighest(以区间≥n为计数范围)9/7/2021计数(续)例:1、学生综合数据(四门课中有几门课成绩在80分以上?)2、住房状况调查数据(P78)3.5分类汇总根据某分类进行分类汇总计算菜单:【Data】-【Aggregate】关键步骤:指定分类变量到【Break】框中指定汇总变量到【AggregateVariable】框中指定汇总变量计算哪些

4、统计量(系统默认计算均值)指定将分类汇总结果保存到何处。两种选择:第一,【Createnewdatafile】第二,【Replaceworkingdatafile】9/7/2021分类汇总(续)例:1、住房状况调查数据.sav(P81)2、学生综合数据(分析男女生各门课平均成绩是否有较大差距;数学、英语成绩80分以上人数比重是否有较大差距?)3.6数据分组是指对数值型数据进行组距分组,以便整理和粗略把握数据分布。组距分组:第一步,依据经验公式确定组数第二步,确定组距数据分组(续)完成以上两步以后,开始进入SPSS实时分组操作。菜单:【Transfo

5、rm】-【Recode】-【IntoDifferentVariables】在数据分组的基础上进行频数分析例:1住房状况调查数据(P84)2ceodata.sav(对年龄数据分组)3.7加权处理菜单:【Data】-【WeightCases】-【Weightcasesby】例:蔬菜销售.sav(P88)取消加权:选择【Donotweightcasesby】3.8数据拆分根据指定变量对数据进行分组,为以后所进行的分组统计分析提供便利。菜单:【Data】-【SplitFile】-【GroupsBasedon】【Analyzeallcases】取消数据拆分【

6、Comparegroups】将分组统计结果输出在同一张表格,便于不同组之间比较【Organizeoutputbygroups】将分组统计结果输出在不同表格。例职工数据.sav(按职称拆分)3.9SPSS变量集通过减少变量显示个数来简化变量选择操作。SPSS变量集包括系统变量集和用户变量集两大类。利用用户变量集分两步:第一步,定义用户变量集菜单【Utilities】-【DefineSets】第二步,指定使用该变量集菜单【Utilities】-【UseSets】例住房状况调查.sav(定义一个含三个变量的变量集)3.10缺失值的替代菜单:【Transf

7、orm】-【ReplaceMissingValues】缺失值替代方法选择:1【Seriesmean】用该变量的所有非缺失值的均值替代2【Meanofnearbypoints】用缺失值相邻点的非缺失值的均值做替代,取多少个相邻点可任意定义3【Medianofnearbypoints】含义同上,用中位数(而非均值)替代4【Linearinterpolation】用缺失值相邻两点的非缺失值的中点值做替代5【Lineartrendatpoint】用线性拟合方式确定替代值3.11为观测量排秩求某个变量值的秩(Rank),用一个新变量(r+原名)保存,而不改变

8、观测量Case原来的顺序,如:求名次菜单:Transform+RankCasesa.选变量:每个变量产生一个秩变量b.选择

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。