资源描述:
《第三章单变量综合性描述统计量.ppt》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第三章单变量综合性描述统计量宇传华本章内容定量资料的描述第一节中心趋势指标一、算术平均数二、中位数三、几何均数四、众数第二节离散与变异性指标一、全距二、方差与标准差三、变异系数四、四分位间距定性资料的描述第二节离散与变异性指标五、多样性指数第三节率、比及其注意事项第一节、中心趋势指标常用的中心趋势指标有:算术均数、几何均数、中位数、众数,统称为平均数(average)一、算术平均数(TheArithmeticmean)简称均数(Mean)或均值,定义为所有测量值之和除以变量值个数(即,样本含量Sa
2、mpleSize)。反映一组呈对称分布的变量值在数量上的平均水平。(1)直接计算法公式:举例1:试计算1,3,7,9的均数?例2:试计算1,3,3,7,7,9,9,9的均数?(2)加权法均数的特征二、中位数与百分位数11个大鼠存活天数:4,10,7,50,3,15,2,9,13,>60,>60平均存活天数?(一)中位数(median)是将每个变量值从小到大排列,位置居于中间的那个变量值。存活天数2,3,4,7,9,10,13,15,50,>60,>60秩次1234567891011计算公式:n为奇
3、数时n为偶数时例9名中学生甲型肝炎的潜伏期分别为12,13,14,14,15,15,15,17,天,求其中位数。19频数表资料的中位数下限值L上限值Ui;fm中位数M中位数=4.5+0.5x[(150x50%-68)/37]=4.59中位数的特征计算时只利用了位置居中的测量值优点:对极值不敏感缺点:并非考虑到每个观测值适用于各种分布类型的资料,特别适合于:大样本偏态分布资料或者一端或两端无确切数值的资料百分位数示意图(二)百分位数(percentile)1.直接计算法设有n个原始数据从小到大排列,
4、第X百分位数的计算公式为:当为带有小数位时:当为整数时:Trunc()取整函数例对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。患者:住院天数:(1)n=120,,为整数:(2),带有小数,故取整trunc(118.8)=118患者:住院天数:2.频数表法公式:例试分别求表3.3频数表的第25、第75百分位数。P25=4.0+0.5x[(150x25%-36)/32]=4.02P75=5.0+0.5x[(150x75%-105)/2
5、2]=5.17三、几何均数(geometricmean)可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。(1)直接法几何均数:变量对数值的算术均数的反对数。其他对数(如自然对数)变换获得相同的几何均数例3.6测定10名伤寒病人血清抗体滴度分别为1:4,1:4,1:4,1:4,1:4,1:16,1:16,1:16,1:64,1:128,求其平均抗体滴度。以其滴度的倒数为原变量值,代入公式有:平均抗体滴度为:1:11(2)加权法公式:例3.6的血清抗体滴度资料的频数表1、几何
6、均数适用于对数正态分布,如药物的效价、抗体的滴度、传染性疾病的潜伏期等资料。2、变量x服从对数正态分布,即表示变量lg(xi)服从正态分布。对于lg(xi),具有正态分布的所有特性。几何均数的特征四、众数(Mode)是一群数据中出现次数(频数)最多的值。适用于大样本;较粗糙。例有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,,61,61,62,62,试求众数。众数的特征1、对于某些数据而言,例如均匀分布,并不存在众数;2、对于某些数据存在两个或多于两个的众数;
7、3、定性数据可以存在众数;众数对于进一步的统计学计算与分析不具备应用价值。58,58,58,58五、其他位置指标1、四分位数(Quartile)(三个四分位数)2、十分位数(Centile):9个十分位数3、百分位数(Percentile)99个百分位数离散与变异性指标全距四分位间距方差标准差变异系数多样性指数全距、四分位间距、方差、标准差、变异系数与多样性指数一、全距(Range)与绝对差全距为最大值与最小值之差,也叫极差缺点:仅利用了两个极端值。二、方差与标准差方差(Variance)也称均方
8、差(meansquaredeviation),反映一组数据的平均离散水平。(一)样本方差为各变量值到样本均数距离的平方和除以自由度的商值,即(二)总体方差定义为样本标准差为样本方差的平方根;总体标准差为总体方差的平方根。标准差(standarddeviation)样本标准差实用公式仍然用钉螺抽样数据为例,1+3+3+7+7+9+9+9=48,n=8样本标准差的加权公式随机变量xi的标准化如果随机变量xi服从正态分布,均数和标准差分别为和s,则随机变量xi的标准化正态离差值(Stan