欢迎来到天天文库
浏览记录
ID:37445097
大小:612.10 KB
页数:17页
时间:2019-05-12
《描述性统计分析过程》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所代表的总体的特征。描述性统计分析的项目很多,常用的如平均数、标准差、中位数、频数分布、正态或偏态程度等等。这些分析是复杂统计分析的基础。平均数、标准误中位数、众数、全距标准差、方差四分位、十分位、百分位数频数分布、峰度、偏度标准分数及其线性转换探索分析交叉列联表分析第二章描述性统计分析过程1.平均数、标准误返回本章首页基本的描述性统计量中位数、众数、全距返回本章首页标准差、方差返回本章首页严格地讲,在方差和标准差的计算中,分母应取n-1,因为数据变异的自由度是n-1。但在大样本情况下,使用n和n-1差别
2、不大。四分位、十分位、百分位数返回本章首页频数分布、峰度、偏度频数(Frequency)就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩,可以统计出各分数值的人数。峰度(Kurtosis):是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于0,其数据分布的陡缓程度与正态分布相同;峰度大于0,其数据分布比正态分布更陡峭;峰度小于0,其数据分布比正态分布更平坦。返回本章首页实例演示偏度(Skewness)是描述数据分布对称性的统计量,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于0,则其数据分布的对称性与正态分
3、布相同;如果偏度大于0,则其分布为正偏或右偏,即在峰的右边有大的偏差值,使右边出现一个拖得较远的尾巴;如果偏度小于0,则为负偏或左偏,即在峰的左边有大的偏差值,使左边出现一个拖得较远的尾巴。返回本章首页实例演示标准分数及其线性转换Z分数:从平均数为,标准差为的总体中抽取一观测值,该观测值的Z分数是其距离总体平均值的标准差数。标准分数反映的是一观测值与其他分数相比的相对位置。比如Z分数为1.5,则其比平均数大1.5个标准差。在实际应用中,为了避免小数的不便,可以对标准分数进行线性转换:T=10Z+50比如某人在艾森克人格问卷的测量中,其精神质得分比同年龄人的平均成绩高2.0个标准差,则其
4、换算后的标准分数为70分;如果另一人的测试分数正好等于平均数,则其标准分数为50。返回本章首页探索分析探索分析是对一组或多组数据的总体分布特征进行分析,以考察其中有无奇异值、极大或极小值等;考察各组数据或全部数据是不是正态或接近于正态分布;探索多组数据之间的方差是否齐性,以确定是否可以采用某种统计分析技术对数据进行检验等等。我们这里介绍:1.用直方图反映数据的分布直观形式;2.用箱图(或叫框图)反映数据的集中趋势和奇异值;3.用Levene检验考察多组间方差是否齐性;4.用Q-Q概率图检验数据是否正态分布或接近正态分布。返回本章首页1.用直方图直观地反映数据的总体分布调用数据文件并得到直方
5、图返回本章首页直方图:是一种频数分布图,它反映处在某一观测值范围内的个案数。图中每个直方条下部的中点坐标是该观测值范围的中点、直方条的宽度代表该观测值范围、直方条的高度代表该观测值范围内的个案数或人数比例。2.用箱图(或叫框图)反映数据的集中趋势和特异值调用数据文件并得到箱图返回本章首页批注:箱图可以直观地反映一组观测值的集中趋势、离散趋势、不正常观测值(奇异值和极值,均可被排除后重新分析)。左图中箱图的高度代表了25%位数到75%位数的距离;箱图中的粗线代表中位数;箱图上下中央的垂直线叫触须线,触须线的上下截止线分别对应于观测值的最大值和最小值;用O标记的是奇异值(与框边距离超出框高1.
6、5倍)、用*标记的为极大值或极小值(与框边距离超出框高3倍)。3.用Levene检验方差是否齐性方差齐性检验是统计分析中的一种常见过程,它是从样本方差以至样本各自所代表的总体方差是否相同而判断两个样本同质性(homogeneity)的方法。简单地说,方差齐性检验就是检验各个方差是否存在显著性差异。一般采用Levene方法:先将各组观测值均转换为离差绝对值,然后对各组离差绝对值进行方差分析,如果方差分析的结果中p>0.05,则认为方差齐性(即方差具有相同性);方差分析的结果中p<0.05,则认为方差不齐性(即方差具有不同质性)。方差齐性检验举例与spss过程演示返回本章首页4.用Q-Q概率图
7、检验数据是否正态分布可以用正态概率Q-Q图和离散正态概率Q-Q图检验观测值的分布是否是或接近于正态分布。正态概率图是由观测值与按正态分布的预期值作出来的散点图,如果实际值为正态分布,则其与预期值具有线性对应关系,散点图回归一条斜线,该斜线是正态分布的标准线,散点图组成的回归线越接近于标准线,表示实际观测数据越接近正态分布;如果以观测值、其与正态分布期望值的离差值做散点图,则当散点近似随机地落在过原点的中间横线周围时,数据
此文档下载收益归作者所有