欢迎来到天天文库
浏览记录
ID:38757573
大小:428.01 KB
页数:56页
时间:2019-06-19
《《基本统计分析》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基本统计分析返回§1频数分布分析返回定义:频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。利用一维频数分布表可以对数据按组进行归类整理,形成各变量的不同水平的频数分布表和图形,以便对各变量的数据特征好观测量分布状况有一个概括的认识。交叉表分析过程可以生成二维或多维频数表,还可以进行分类变量之间的独立性检验。返回一、一维频数分布分析过程(data05-01)
2、Analyzedescriptivestatisticsfrequencies选择statistics(输出统计量)对话框返回如果中位数与众数相差很大,说明观测量中存在异常值Charts(图形)参数选择对话框返回频数分布表format(格式)对话框返回Data05-01ageeudc不同年龄人员与其受教育年限的统计表返回受教育年限的频数分布表返回age变量的直方图返回educ变量直方图返回二、交叉表分析analyzedescriptivestatisticscrosstabs(data05-01)返回前面的分析都是对单个变量的数据分布情况
3、进行分析。但在实际分析中,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。交叉列联表分析除了列出交叉分组下的频数分布外,还需要分析两个变量之间是否具有独立性或一定的相关性。要获得变量之间的相关性,仅仅靠频数分布的数据是不够的,还需要借助一些变量间相关程度的统计量和一些非参数检验的方法。常用的衡量变量间相关程度的统计量是简单相关系数(参见本书有关章节),但在交叉列联表分析中,由于行列变量往往不是连续变量,不符合计算简单相关系数的前提条件。因此需要根据变量的性质,选择其他的相
4、关系数,如Kendall等级相关系数、Eta值等。SPSS提供了多种适用于不同相关系数的相关关系,这些检验的零假设是:行和列变量之间彼此独立,不存在显著的相关关系。SPSS将自动给出检验的P值,如果P值小于显著性水平0.05,那么应拒绝零假设,认为行列变量之间彼此相关。计算公式如下。(1)卡方统计量检验是常用的检验行列变量之间是否相关的方法。交叉列联表的卡方检验零假设是:行列变量之间独立,计算公式为卡方统计量服从(行数−1)×(列数−1)个自由度的卡方统计,SPSS在自动计算卡方统计量后,还会给出相应的P值。注意:使用这个统计量进行检验时,要求期
5、望频数大于等于5。若不满足该条件需要使用精确检验法。(2)Contingencycoefficient:列联系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为其中,N为观测量数其数值在0~1之间,0表示行列变量之间没有关联,1表示行列变量之间有很强的关联。(3)PhiandCramer‘sV:ψ系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为数值界于0~1之间,其中K为行数和列数较小的实际数。返回一个行变量和一个列变量可以形成一个二维交叉表,再指定一个分组变量作为控制变量就形成三维交叉表。如果可以
6、指定多个行、列、控制变量,就会形成一个复杂的多维交叉表。交叉表的数据可以是数值型或字符型变量,短字符串变量可以直接作为分类变量。选择statistics(统计量)对话框返回Exact(精确检验)对话框返回提供两种针对小数据量与不平衡表的检验方法此值小于0.05则认为行、列变量存在关系Cells(显示单元格)对话框返回Format(格式)对话框返回大样本的交叉表实例Data05-01child/occcat80/region观测量统计处理摘要返回返回卡方检验返回小样本的交叉表实例data05-02sex/earnings观测量统计处理摘要返回交叉表
7、及卡方检验结果返回§2描述统计返回描述统计分析对话框analyzedescriptivestatisticsdescriptives(data05-03)返回Options(选择项)对话框返回全美各种犯罪数据描述统计量返回§3探索分析返回定义:调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。探索分析提供对数据的考查:1.检查数据是否有错误。过大或过小的数据均有可能是奇异值、影响点或错误数据。
8、2.数据分布特征。许多分析方法对数据的分布有一定要求。许多分析方法要求样本来自正态分布总体,对两组数据均值差异性的分析要求方差相等。EX
此文档下载收益归作者所有