欢迎来到天天文库
浏览记录
ID:59207237
大小:606.50 KB
页数:42页
时间:2020-09-26
《第4章spss描述性统计分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第4章描述性统计分析描述性分析有两方面功能:数值计算,即通过计算常见统计量值,反映样本数据的统计特征;图形绘制,即通过绘制常见统计图形,直观展现数据的分布特征,比较数据分布的异同。实现描述性统计分析功能在Analyze→DescriptiveStatistics菜单。SPSS的描述性分析功能模块有:1)Frequencies:频数分析,描述统计数据的频数分布特征2)Descriptive:基本描述统计,对单变量计算基本描述统计量3)Explore:探索性分析,考察一些极端值和奇异值;考察变量与变量间分布的差异是否显著4)Crosstabs:交叉列联表,讨论变量间的频数关系
2、及各种测度(定类、定序、定距、定比)间的相关关系5)Ratio:比率分析,对两变量间变量值比率变化的描述分析进行频数分布表的分析,适合于定性资料,以及部分定量资料,不能分组进行。对数据的分布趋势进行初步分析。基本概念:频数(Frequency):百分比(Percent,频率):有效百分比(ValidPercent):各频数占有效样本数(除去缺失样本数)的百分比。累计百分数(CumulativePercent):最后累积取值100。4.1Frequencies(频数分析)频数分析中常用的三种基本统计图:特点:宽度(类别)相同,高度表示频数或频率,常分开排列。适于定类、定序资
3、料条形图(柱形图BarChart)饼图(PieChart)直方图(Histograms)特点:扇形面积表示频数或百分比。适于研究内在的结构组成。特点:矩形面积表示频数或频率,宽为组距,高为密度,可附正态线,也称质量分布图。适于定距资料。【实例4.1】计算全部学生英语、数学及语文三门成绩的均值、标准差、极差和四分位数,并生成语文成绩各区间的频数分布表和显示频数的饼图。Statistics按钮:四分位数按输入值定义等分位数按输入不同值定义分位数Charts按钮:结果:4.2Descriptive(基本描述统计)对变量进行整体描述性统计分析,但不能分组进行,包括集中趋势值,离散
4、趋势值,偏度系数,峰度系数等。最适合服从正态分布的定量资料,使用频率最高,且可将原始数据转换成标准Z分值并存入数据库。常见基本描述统计量大致有三类:描述集中趋势:反映一组数据的共同趋势,即反映数据一般水平的中心值或代表值。如样本均值、中位数、众数、总和等。描述离散趋势:反映一组数据的各观测值距离中心的离散程度。如样本方差、标准差、极差、最大值、最小值及均值标准误差等。描述分布形态:考察数据分布是否对称、偏斜程度及陡缓程度。主要指偏度和峰度。偏度系数:反映数据形态对称性。峰度系数:反映分布形态陡缓程度。【实例4.2】计算全部学生三门成绩的均值、标准差、最大值及最小值,并考察
5、学生成绩的分布形态。Options按钮:结果:4.3探索性分析(Explore)能分组进行分析,适用于对资料的性质、分布特点完全不清楚情况,有助于确定对数据进行进一步分析的方案。主要对数据进行三方面考察:考察数据真实性:找出偏离主体较远的数据,如非正常值和极端值,分析之,并判断其正确性。考察数据的分布特性:主要考察数据的正态性。考察变量间数据的相互关系:考察变量间相关性及方差齐性。考察变量列表分组变量主要功能:1、通过茎叶图(StemandleafPlots)描述频数分布茎(Stem):整数部分,其值为Stem乘以Stemwidth,可以多位,表示该行出现数的相同部分叶(
6、Leaf):小数部分,其值为Leaf乘以Eachleaf,只能一位,表示该行出现数的不同部分茎叶图可以观察出现同茎,不同叶组成数出现的频数。如第三行数据表示:总共3个case,其中一个9x10+0=90,2个9x10+2=922、通过箱图(Boxplots)描述数据分布箱图主体:图中个案数占50%(大于25%且小于75%的百分位数)箱图本体:矩形部分,上下边对应上下四分位数奇异值(上下)o:超过箱图本体高度1.5倍的数据。极端值(上下)﹡:超过箱图主体高度3倍的数据。中位数箱线图是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方
7、法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息正常值分界点3、通过Q-Q概率图描述数据分布的正态性Q-Q概率图有两种:(1)正态概率图(NormalProbabilityPlots)-直观反映实际分布和理论分布的差异。如图,纵坐标为Z分数值,斜线为Z分数期望标准线。点越趋近斜线,则越符合正态分布。(2)反趋势正态概率图(DetrendedNormalProbabilityPlots)-直观反映实际分布和理论分布的差异。如图,纵坐标为Z分数值-正态分布期望值,水平线为期望标准线。点越趋近水平线,则越符合正态分布
此文档下载收益归作者所有