连续性变量的统计描述与参数估计.ppt

连续性变量的统计描述与参数估计.ppt

ID:60979971

大小:311.50 KB

页数:44页

时间:2021-01-16

连续性变量的统计描述与参数估计.ppt_第1页
连续性变量的统计描述与参数估计.ppt_第2页
连续性变量的统计描述与参数估计.ppt_第3页
连续性变量的统计描述与参数估计.ppt_第4页
连续性变量的统计描述与参数估计.ppt_第5页
资源描述:

《连续性变量的统计描述与参数估计.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第5章连续性变量的统计描述与参数估计连续变量的统计描述概述1统计描述中的可用工具(1)各种初步汇总描述方法频数、百分位数。(2)各种统计描述指标均值、标准差、四分位数间距。(3)统计表(4)统计图5.1连续变量的统计描述指标体系(1)集中趋势(CentralTrend):均数(Mean)中位数(Median)截尾均数(TrimmedMean)几何均数(GeometricMean)众数(Mode)调和均数(HarmonicMean)(4)其他趋势单峰双峰分布、极端值(Outlier)。(2)离散趋势(DispersionTrend)全距(Range)、标准差

2、(Std.Deviation)和方差(Variance)、百分位数(Percentile)、四分位数,四分位间距、变异系数(3)分布特征(DistributionTendency)偏度系数(Skewness)和峰度系数(Kurtosis)2集中趋势的的描述指标1算术平均算术平均(ArithmeticMean)是最常用的描述数据分布的集中趋势的统计量。总体均数(PopulationMean)用希腊字母表示,样本均数常用表示。一、算术平均数的定义和性质二、均数的意义任何一个平均数值首先是同类现象的平均数。任何一个平均数总是一个平衡点。但平均数在高度概括观测数据

3、从而使问题简化的同时,却丢失了某些有用的信息,一方面它把各个观测数据之间的差异性掩盖了起来,另一方面由于平均数对于个别极端值反应比较灵敏,因而平均数在某些情况下可能具有一定的欺骗性。三、均数的适用范围严格的讲平均数指示用于定距变量。但有时对于定序变量,求平均等级也可以使用平均数。2中位数中位数(Median)是将总体各单位的标志值按大小顺序排列,处于中间位置的那个标志。一、中位数的定义对于未分组的原始资料,首先必须将标志值按大小顺序。设排序结果为:则中位数就可以按下列方式确定:二、中位数的适用范围3其他集中趋势指标一、截尾均数由于均数较易受极端值的影响,因

4、此可以考虑将数据排序后,按照一定的比例去掉最两端的数据,只是用中部的数据来求均数。如果截尾均数和原均数相差不大,则说明数据不存在极端值,或者两侧极端值的影响正好抵消;反之,则说明数据中有极端值,此时截尾均数更好地反映数据的集中趋势。常用的截尾均数有5%截尾均数,即两端各去掉5%的数据。二、几何均数几何均数适用于原始数据分布不对称,但经过对数转换后呈对称分布的资料。几何均数实际上就是对数转换后的数据lgX的算术平均数的反对数。四、调和均数它实际上是观察值X倒数之均数的倒数。三、众数(Mode)众数指的是样本数据中出现频次最多的那个数。众数适用于任何层次的变量

5、,特别适用于单峰对称的情况,是比较两个分布是否接近首先要考虑的参数。在SPSS中,众数可以在Report子菜单和Tables子菜单的全部报表过程和制表过程中计算出来。在SPSS中,调和均数可以在Report子菜单的4个报表过程过程中计算出来。3离散趋势的描述指标1全距(Range)又称为极差,是一组数据中最大值(Maximun)与最小值(Minimum)之差。极差反映的是变量分布的差异范围或离散程度,在总体中,任何两个标志值之差都不可能超过极差。极差存在两点不足:一是它仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,提供的信息太少。二是它容易受个别

6、极端值的影响,不符合稳健型的要求。2方差和标准差一、方差(Variance)和标准差(StandardDeviation)的定义将离均差平方和(SumofSquaresofDeviationfromMean,SS)除以观察例数N,就得到方差:方差越大,数据分布离散程度越大。对于样本数据而言,方差的计算公式为:将方差开方,就得到标准差。对于同性质的数据来说,标准差越小,表明数据的变异程度越小,即数据越整齐,数据的分布范围越集中;标准差越大,表明数据的变异程度越大,即数据越参差不齐,分布越分散。二、方差和标准差的适用范围:方差和标准差的适用范围应当是正态分布。

7、3百分位数、四分位数与四分位数间距分位差是对极差指标的一种改进,是从变量数列中剔除了一部分极端值后重新计算的类似于极差的指标。常用的分位差有四分位差、十分位差、百分位差。一、分位数分位数:是一种位置指标,用PX表示。一个百分位数PX将一组观测值分为两部分,理论上有x%的观测值比它小,(100-x)%的观测值比它大。四分位数(quartile)、十分位数(decile)、百分位数(percentile),他们分别是用3个点、9个点、99个点将数据4等分、10等分和100等分后各分位点上的值。二、四分位数四分位数:实际上是三个数值的总称,分别是P25、P50、

8、P75分位数。很显然,中间的分位数是中位数,因此通常所说的四分位数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。