《SPSS之数据描述》PPT课件

《SPSS之数据描述》PPT课件

ID:41113106

大小:664.51 KB

页数:48页

时间:2019-08-16

《SPSS之数据描述》PPT课件_第1页
《SPSS之数据描述》PPT课件_第2页
《SPSS之数据描述》PPT课件_第3页
《SPSS之数据描述》PPT课件_第4页
《SPSS之数据描述》PPT课件_第5页
资源描述:

《《SPSS之数据描述》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四讲:SPSS之数据描述同济大学社会学系2011年本讲内容各种变量的描述及在SPSS中的实现SPSS统计图表多分类变量的统计描述对变量分布的检验列联表交叉分析各种变量的描述及在SPSS中的实现集中趋势在一组统计数据中,往往用其中一个数值来代表本组数据的平均状况。不同类型变量的集中趋势数值表示方法不同。定类变量一般用众值(mode)来表示它的集中趋势,定序变量用中位值(median),定距变量和定比变量用平均值来表示(mean)。离散趋势用一个或几个数据来表示整组数值偏离集中趋势的程度。不同类型变量表示离散

2、趋势的数值也有差异。如定类变量通常使用异众比率(=1-众数的频次/总频次),定序变量有四分位差、百分位差,定距(定比)变量有极差、方差、标准差等。各种统计指标在SPSS中的实现上述离散趋势指标和集中趋势指标都可以通过spss菜单来完成操作,具体方式:Analyze--DescriptiveStatistics—Frequency(频数分析),打开对话框,选择需要分析的变量,点击statistics选择需要计算的统计值,continue返回;点击chart,可输出变量的一些简单统计图形;点击format,可以

3、选中输出频数表的格式操作过程选择变量选择待计算的统计值选择图表类型选择频数分布格式SPSS统计图表统计图表SPSS中提供了各种类型的柱状图、折线图、直方图、散点图、箱形图和茎叶图等。散点图在回归分析之前使用较多,用于查看变量分布特征;箱形图和茎叶图,用于检查是否存在异常值;其他类型图可在excel中实现,比较美观。箱形图(boxplot)箱子的中间横线是数据的中位数(median),封闭箱子的上下两横线(边)分别为第三四分位数和第一四分位数。最上方和最下方的线段分别表示最大值和最小值。箱图最上方和最下方的星

4、号、圆圈分别表示极端值。茎叶图(stem-and-leafplot)特点是直观的反映了数据的原貌;原理:将数值中不变或变化不大的数值作为茎(主干),将变化较大的数字作为叶,放在茎的后面。箱形图和茎叶图可以通过analyze—descriptivestatistics—explore分析过程来实现。Data11-7箱形图和茎叶图的实现过程箱形图茎叶图多分类变量的统计描述多分类变量定义多分类变量即是问卷中的多选题。根据固定选或不定选的差异,在定义多分类变量时方法稍有差异。在固定选的多分类变量定义中,主要是累计所

5、有可能的取值,累积的范围是该变量的所有编码。在不定选的多分类变量定义中,主要是累计被访者选中的变量(编码是1的部分)。新定义的多分类变量,不能保存,关闭数据库之后会丢失相关信息。下次分析时需重新定义。多分类变量定义过程频数分析变量分布特征常见变量分布在很多统计模型中,对变量的分布有一定约束,如在回归分析中,要求因变量总体分布及子样本分布呈正态分布。变量常见分布有:二项分布,多项分布,泊松分布、卡方分布、t分布、F分布、正态分布等等;分布特征检验可以通过P-P图和Q-Q图的方法来检验某变量的分布是否符合某一分

6、布特征;在结果显示中,如果某变量的实际累积频率和期望累积概率比较接近的话,则表明该变量符合某种类型的分布;在SPSS15.0以上版本中,P-P图和Q-Q图在analyze—descriptivestatistics—菜单下,以下版本在Graphs菜单下。P-P图操作P-P图显示结果Q-Q图操作Q-Q图结果偏度(Skewness)是描述某变量取值分布对称性的统计量。具体的计算公式为偏度为0表示其数据分布形态与正态分布偏度x相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示

7、负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。峰度(Kurtosis)峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。具体的计算公式为偏度和峰度在SPSS中实现方法同频数分析;在statistics对话框中分别选择峰度和偏度即可选择偏度和峰度列联表交叉分析交叉分析前面的分析都是

8、对单个变量的数据分布情况进行分析。但在实际分析中,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。交叉列联表分析除了列出交叉分组下的频数分布外,还需要分析两个变量之间是否具有独立性或一定的相关性。要获得变量之间的相关性,仅仅靠频数分布的数据是不够的,还需要借助一些变量间相关程度的统计量和一些非参数检验的方法。交叉分析的使用交叉分析一般用于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。