第05讲 连续变量的统计描述与参数估计.ppt

第05讲 连续变量的统计描述与参数估计.ppt

ID:48701677

大小:321.50 KB

页数:38页

时间:2020-01-19

第05讲 连续变量的统计描述与参数估计.ppt_第1页
第05讲 连续变量的统计描述与参数估计.ppt_第2页
第05讲 连续变量的统计描述与参数估计.ppt_第3页
第05讲 连续变量的统计描述与参数估计.ppt_第4页
第05讲 连续变量的统计描述与参数估计.ppt_第5页
资源描述:

《第05讲 连续变量的统计描述与参数估计.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Lesson5连续变量的统计 描述与参数估计基本概念复习总体(population)与样本(sample)◆总体:根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。◆样本:是从总体中抽取的部分个体◆由于直接研究总体经常是不可能的,故而大多采用抽样研究,即通过抽取样本来推断总体--统计推断参数和统计量◆参数:刻画总体特征的指标称为总体参数。用来确定某一分布的特征;如总体均数,总体分布往往是已知的◆统计量:刻画样本特征的统计描述指标称为统计量。由观察资料计算出来的量;可以用来近似的反映总体参数◆统计的任务:由

2、样本估计总体,由样本统计量估计总体参数一.连续变量的统计描述的工具(一)频数表Frequency直观的方法:分布类型分布特征看出集中趋势与离散趋势发现特大与特小值便于进一步计算统计指标和做统计处理(二)统计指标集中趋势Centraltendency均数mean、中位数median、众数mode等离散趋势Dispersiontendency全距Range、方差Variance、标准差std.deviation、百分位数、变异系数CV等分布特征Distributiontendency偏度系数Skewness、峰度系数Kurtosis等

3、其他在SPSS中出现的指标M统计量(三)统计表(四)统计图直方图(Histogram)箱式图(boxplot)茎叶图(stem-and-leaf)QQ图1.集中趋势的描述指标算术平均数(arithmeticmean)◆简称均数(mean),有总体均数(PopulationMean,)和样本均数之分◆适用于对称分布,特别是正态分布的资料,不适用于偏态分布的资料。◆对于严重偏态分布的资料,均数将失去它应有的代表性。中位数(Median)◆是一组观察值的位置平均数,◆用于描述偏态分布资料的集中位置,它不受两端特大、特小值的影响,当分布末

4、端无确切数据时也可计算。◆对于没有分组的原始数据,必须先将标志值按大小顺序排序,截尾均数(trimmedmean)◆数据排序后按照一定比例去掉两端的数据求均数◆适用于两端有极端值的资料◆常用5%截尾均数几何均数(geometricmean,G)◆适用于呈倍数关系的等比资料或对数正态分布的资料,尤其是对数正态分布的计量资料◆应用中应注意观察值不能同时有正有负◆同一资料算得的几何均数小于算术均数(1)直接法众数(mode)◆样本数据中出现频次最高的数字◆适用于单峰对称的数据,反映出现频次最高的数据情况调和均数(H)◆观察值倒数的均数的

5、倒数,较少使用3组同龄男孩体重(KG)如下◆甲组2628303234◆乙组2427303336◆丙组2629303134◆均数相等,但各组差异不同◆对连续变量的描述,需要将集中趋势和离散趋势结合起来,才能对其分布有全面的认识。2.离散趋势的描述指标全距(Range,R)◆又称极差,即最大和最小观察值之间的间距,◆用全距描述资料的离散程度简单明了,但它不能反映观察值的整个变异度,样本的例数越多,极差越大,越不够稳定。◆所以一般只用于预备性检查,大致了解数据的分布范围。方差(variance)与标准差(standarddeviatio

6、n)◆离均差平方和(sumofsquaresofdeviatonsfrommean,SS):可用来描述资料的离散程度。◆SS的均数(即方差)不受观察值个数的影响,用来描述资料的离散程度更好。◆实际中,得到的常是样本资料,总体均数未知,只能用样本均数代替,得到样本方差S2◆n-1为自由度(degreeoffreedom)◆因方差的单位是原单位的平方,所以使用仍不方便。方差的算术平方根,即标准差(standarddeviation)是一个更好的指标。◆标准差也有总体标准差和样本标准差之分:◆适用范围:◆方差和标准差适合于对称分布,特别

7、是正态分布及近似正态分布资料◆标准差可用于描述变量值的离散程度,与均数结合还可描述资料的分布情况,此外还可用于求参考值范围和计算标准误。◆描述分布偏离正态分布的程度,即偏离对称的程度。偏(斜)度(Skewness):偏度系数◆Skewness>0:正偏或右偏(长尾在右边)Skewness<0:负偏离左偏(长尾在左边)◆描述分布变量取值分布形态陡缓程度的统计量。峰(峭)度(Kurtosis)峰度系数◆Kurtosis>0分布集中趋势强Kurtosis<0分布离心趋势强百分位数(percentile)◆百分位数是一个位置指标,Px表示

8、是资料分布数列的百等份分割值。◆中位数是特定的百分位数,即P50◆用于描述样本或总体观察值序列某百分位置的水平,应用中注意,样本例数不够多时,两端的百分位数不稳定。◆还用于确定参考值范围(referencerange)。四分位数间距(quartil

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。