欢迎来到天天文库
浏览记录
ID:44703559
大小:702.51 KB
页数:11页
时间:2019-10-25
《Spss的数据预处理》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、Spss的数据预处理一、数据预处理的目的:在数据文件建立好后,通常还要对待分析的数据进行必要的预加工处理,这是数据分析过程中不可缺少的一个关键环节。数据的预加工处理是服务与数据分析和建模的,需要解决的问题如下:1、缺失值和异常数据的处理。2、数据的转换处理。数据的转换处理是在原有数据的基础上,计算产生一些含有更丰富信息的新数据或对数据原有分布进行转换等。3、数据抽样。从实际问题、算法或效率等方面考虑,并非收集到的所有数据(个案)在某项分析中都有用途,有必要按照一定的规则从大量数据中选取部分样本参与分析。4、选取变量。并非所有数据
2、项(变量)在某项分析中均有意以,选取部分变量参与分析是必要的。Spss提供了一些专门的功能辅助用户实现数据的预加工处理工作,通过预处理还可以使用户对数据的总体分布有所了解。二、数据预处理步骤:1、数据的排序:(1)数据排序的目的:a、通常数据编辑窗口中个案的前后次序是由数据数录入的先后顺序决定的,数据排序便于数据的浏览,有助于了解数据取值状况、缺失值数量的多少。b、通过数据排序能够快速找到最大值和最小值,进而可以计算出数据的全距,快速把握和比较数据的离散程度。c、通过数据排序能够快速发现数据的异常值。(2)、数据排序的步骤:a
3、、选择菜单:【Date】→【SortCases】b、指定主排序量到【Sortby】框中,并选择【SortOrder】框中的选项指出该变量按升序还是降序排序排序。【Ascending】表示升序,【Descending】表示降序。c、如果是多重排序,还要依次指定第二、第三排序变量及相应的排序规则。否则本部可略。排序窗口如下图:图12、变量计算:(1)变量计算的目的:a、通过数据的转换处理,在原有数据的基础上,计算产生一些含量更丰富的新数据。b、对数据的原有分布状态进行转换,由于数据分析和建模中某些模型对数据分布有一定的要求,因此可
4、以利用变量计算对原有数据的分布进行转换。c、spss变量计算是在原有数据的基础上,根据用户给出的spss的算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量。(2)变量计算的操作步骤:a、选择菜单:【Transform】→【ComputeVariable】出现如图2所示窗口:图2b、在【NumericExepression】框给出spss算术表达式和函数。可以手工输入也可以按窗口的按钮算数表达式和函数的输入工作。c、在【TargetVariable】框中输入存放结果的变量名。d、如果用户只希望对符合一定条
5、件的个案计算产生变量,则按if按钮,出现如图3所示的窗口。选择【Includeifcasesatisfiescondition】选项,然后输入条件表达式,否则本步略去。图33、变量的选取:(1)数据选取的目的:a、提高数据的分析效率。b、检验模型。(2)数据选取的步骤:a、【Date】→【SelectCase】b、在【Select】框中选择选取方法。如图4所示:图44、计数:(1)计数的目的:把握个案各方面的特征。(2)计数的步骤:a、选择菜单:【Transform】→【CountValueswithinCases】如图5所示:
6、b、选择参与计数的变量到【NumericVariables】框中。c、在【TargetVariable】框中输入存放技术结果的的变量名,并在【TargetLabel】框中输入相应的变量名标签。图5d、按DefineValues按钮定义计数区间,出现图6所示窗口。通过Add、Change、Remove按钮完成计数区间的增加、修改和删除。e、如果仅希望对满足条件的个案进行计数,则按if按钮并输入spss相应表达式。否则本部可略。图65、分类汇总:(1)【Date】→【Aggregate】(2)指定分类变量到【BreakVariab
7、les】框中,指定汇总变量到【aggregatedVariables】框中,如图7:(3)按function按钮指定对汇总变量计算那些统计量。Spss默认计算均值。(4)制定将汇总结果保存到何处。(5)按name&Lab按钮重新指定汇总结果中的变量名或变量名标签。(6)如果希望在结果文件中保存各分类组的个案数则选择【Numberofcases】.6、数据分组:(1)【Transform】→【RecodeintoDfferentVariables】(2)选择分组变量到【NumericVariable—>Output】框中。(3)在
8、【NumericVariable】框中的【name】后输入存放分组结果的变量名,并按change按钮确认。(4)按oldandnewValues按钮进行分组区间定义。如图8所示:(5)如果只对符合条件的个案进行分组,则按if按钮输入spss条件表达式。7、数据转
此文档下载收益归作者所有