欢迎来到天天文库
浏览记录
ID:5659409
大小:337.50 KB
页数:49页
时间:2017-11-16
《spss描述性统计基础.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二部分统计描述与统计图表主要内容1、连续变量的统计描述与参数估计2、分类变量的统计描述与参数估计3、数据的图形展示2.1连续变量的统计描述与参数估计描述性统计分析是指用少量数字(即描述指标)概括大量原始数字,对数据进行描述的统计方法。主要包括以下几个趋势:1、集中趋势:用于描述集中趋势的统计量称为位置统计量(LocationStatistic),如均值、中位数等;2、离散趋势:用于描述数据波动范围的大小又称为尺度统计量(ScaleStatistic),如标准差、方差、四分位数间距等;3、分布特征:在分布假设下,描述数据偏离分布的严重程度,如偏度系数
2、和峰度系数等;4、其他趋势:如百分位数指标、M统计量、极端值等。本节主要讲述连续变量(Scale型)的统计描述。2.1连续变量的统计描述与参数估计SPSS用于连续变量统计描述的过程均击中在DescriptiveStatitics子菜单中,包括:1、Frequencies过程:产生原始数据的频数表,并能计算各种百分位数,以及为数据直接绘制相应的统计图;2、Descriptives过程:用于进行一般的描述统计,特别适用于服从正态分布的连续型变量的统计描述;3、Explore过程:用于对连续型数据的分布状况不清楚时的探索性分析;4、Ratio过程:用于对两个连
3、续型变量计算相对比指标。2.1.1描述指标简介集中趋势的描述指标1、算数平均值(ArithmeticMean)对于一组数据而言,算数均值为:对应的离差和为:2.1.1描述指标简介集中趋势的描述指标2、中位数(Median)将数据按大小顺序排列,处于中间未知的量。中位数是位置平均数,不收极端值的影响,在具有个别极大或极小标志值的分布数列中,分位数比算数均值更具有代表性。2.1.1描述指标简介集中趋势的描述指标3、其它指标截尾均值:由于均值较易受极端值的影响,则按照一定比例去掉两端的数据,只使用中部的数据来求的均值。如5%截尾均值。几何均值:众数(Mode)
4、:样本中出现频数最大的数。调和均值(H):数据倒数均值的倒数。2.1.1描述指标简介离散趋势的描述指标1、全距(Range):全距又称极差,是数据中最大值和最小值之差。2、方差(Variance)和标准差(StandardDeviation)2.1.1描述指标简介离散趋势的描述指标3、百分位数(Percentile)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。4、四分位数(Quartile)及四分位数间距(Q1,Q2,Q
5、3)可用于排除部分极端值对变异指标的影响,适用于任意分布的数据。2.1.1描述指标简介离散趋势的描述指标5、变异系数(CoefficientofVariation)在许多情况下无法使用样本方差来比较两组数据间离散程度的大小,则可使用变异系数来比较。2.1.1描述指标简介其它描述指标1、峰度系数(Kurtosis)峰度系数是用来反映频数分布曲线顶端尖峭或扁平程度的指标。峰度系数为0,说明其峰度与正态分布相同;大于0,说明其比正态分布要陡峭;小于0,说明其比正态分布要平缓。2.1.1描述指标简介其它描述指标2、偏度系数(Skewness)偏度系数用以测度数据
6、分布与正态分布相比的不对称性情况,刻画以平均值为中心的偏向情况,其小于0,表示负偏,即均值在峰值的左边;其大于0,表示正偏,即均值在峰值的右边;其等于0,表示对称分布。2.1.2连续型变量统计描述实例以student.sav数据文件为例,对男性和女性身高数据进行统计描述,并对分析结果进行解读。1、使用Explore过程进行分析;2、使用Descriptive过程进行分析;3、使用Frequencies过程进行分析。2.1.3连续型变量的参数估计根据样本数据对总体的客观规律性作出合理估计的过程称为统计推断(StatisticalInference),其分为
7、参数估计和假设检验两大类。其中参数估计是指用样本信息来推断总体特征中的未知参数。正态分布及标准正态分布是统计分析中的重要分布,SPSS中的Descriptive过程可以将原变量标准化。Explore过程也可进行变量的标准化,还可输出参数估计结果。2.1.3连续型变量的参数估计正态分布的专用统计量:1、偏度(Skewness):用来描述变量取值分布形态的统计量,指分布不对称的方向和程度,记为α。2、峰度(Kurtosis):用来描述变量取值分布形态陡缓程度的统计量,是指分布图行的尖峭程度或峰凸程度,记为β。2.1.3连续型变量的参数估计点估计的基本方法:1
8、、矩估计法2、极大似然估计法3、稳健估计法(M-Estimator)矩估计法和极
此文档下载收益归作者所有