实验五描述性统计分析

实验五描述性统计分析

ID:22864233

大小:439.00 KB

页数:15页

时间:2018-11-01

实验五描述性统计分析_第1页
实验五描述性统计分析_第2页
实验五描述性统计分析_第3页
实验五描述性统计分析_第4页
实验五描述性统计分析_第5页
资源描述:

《实验五描述性统计分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第二篇数据分析基础实验五描述性统计分析实验目的:了解相关系数和偏相关系数的计算方法。实验工具:SPSS描述性统计分析菜单项。知识准备:一、统计整理统计整理是根据统计研究的目的,对统计调查所获得的大量原始资料(初级资料),进行科学的分类和汇总,使之条理化、系统化,得出能够反映现象总体特征的综合资料的工作过程。统计整理的结果为统计表与统计图。统计表主要表现为频数表,而统计图的表现形式多样,前面已经介绍了各种统计图的制作方法,此处不在专门进行介绍。二、集中趋势的测量集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势

2、也就是寻找数据一般水平的代表值或中心值。集中趋势主要依赖各种平均指标进行反映。1、算术平均数算术平均数又称为均值,其定义为:设,,…,是取自某总体的一个样本,它的算术平均数算术平均数有四个重要性质:①各变量值与平均数离差之和等于零;②各个变量值与平均数离差平方和为最小值;③常数的算术平均数是其本身;④对于任何两个变量和,它们的代数和的算术平均数就等于两个变量的算术平均数的代数和。2、调和平均数调和平均数是根据标志值的倒数计算的,它是标志值倒数的算术平均数的倒数。调和平均数的计算公式为:使用调和平均数要注意三个问题:

3、①变量的取值不能为零,因为零不能作为分母,此时调和平均数无法计算;②调和平均数与算术平均数一样,易受极端值的影响③调和平均数只适用于特殊的数据情况,所以要注意区分它的适用条件。在SPSS中,调和平均数可以在Report子菜单的4个报表过程中计算输出。3、几何平均数几何平均数是个变量值乘积的次方根。凡是现象的连乘积等于现象的总比率或总速度都可用几何平均数来计算它们的平均比率和平均速度。其计算公式为:式中:在SPSS中,几何平均数可以在Report子菜单的4个报表过程中计算输出。4、众数众数是一个总体中或分布数列中,出

4、现次数最多的变量值。众数是随机变量的一种位置特征数,在单峰分布场合,众数附近常是随机变量最可能取值的区域,服装、鞋、帽等行业非常重视众数,因为众数就是最普遍、最众多的尺码,生产这种尺码给他们带来的利润最大。在SPSS中,众数可以在Report子菜单和Tables子菜单的全部报表过程和制表过程中计算输出。5、中位数中位数它是把样本中各单位标志值按大小顺序排列,位于数列中点位置的标志值就是中位数。也就是说,数列中有一半单位的标志值小于中位数,另一半单位的标志值大于中位数。在计算中位数时,首先必须将数据按大小排序,即计算

5、次序统计量。排在中间位置的就是中位数。设次序统计量为:其中为最小值,为最大值。若n为奇数,则第项的标志值就是中位数;若n为偶数,则中位数等于第项的标志值与第项的标志值的简单算术平均数。即:6、截尾均值将数据按由小到大顺序排列后,因数据两端的值不够稳定,按一定比例除去数据头尾两端一定数量的观测值,然后再求平均,这样得到的均值就称为截尾均值。三、离中趋势的测量变异指标反映的是各变量值远离其中心值的程度,即反映数列中各标志值的变动范围或离差程度。平均指标将数据的数量差异抽象化了,用一个代表数值反映现象的一般水平,反映的是

6、各单位某一数量标志的共性,而不能反映它们之间的差异性。因此仅用平均指标还不能全面描述数据分布的特征,标志变异指标弥补了这个不足,从另一方面说明数据分布的特征,反映的是数据分布的离中趋势。1、全距全距又称极差,是最大值与最小值之差。计算公式为:极差常在小样本的场合使用,而在大样本场合很少在实际中应用。这是因为极差仅使用了样本中两个极端点的信息,而把中间的信息都丢弃了,当样本容量越大时,丢弃的信息也就越多,从而留下的信息过少,其使用价值就不大了。2、四分位差是来自某总体的一个样本,其次序统计量为,样本的分位数是指由下式

7、求得的统计量:上式中的是不超过的最大整数。样本的分位数表示容量为的样本中约有个数小于。时,即为样本中位数,另外,在描述数据位置时常用到四分位数,即与的分位数与并常将它们记为与,分别称它们为第一四分位数与第三四分位数,或下四分位数和上四分位数,它反映了有四分之一的数据小于,有四分之一的数据大于,而有一半数据介于与之间。如果用上四分位数减下四分位数,可得“内四分位间距”或“四分位间距”。这个指标与一般极差的区别在于计算范围较窄,排除了部分极端值对变异指标的影响。但在运用指标进行分析时,人们一般习惯于取四分位间距的一半,

8、称为“四分位差()”Q.D.=3、异众比异众比率又称离异比率或变差比,是指非众数组的频数占总频数的比率,其计算公式为:式中,为异众比率;为变量值的总频数;为众数组的频数。异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。异众比率主要用于测试定类数据(类别数据)的离散程

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。