欢迎来到天天文库
浏览记录
ID:26152157
大小:301.50 KB
页数:43页
时间:2018-11-25
《数值变量资料的统计分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第九章数值变量资料的统计分析中山大学公共卫生学院医学统计与流行病学系张晋昕2010.03.011统计描述统计分析统计推断2统计描述统计分析统计推断3表9-1某地140名健康成年男子的血清尿素氮浓度(nmol/L)资料。4表9-1某地区140名健康成年男性血清尿素氮浓度(nmol/L)5第一节数值变量资料的统计描述【例9-1】某地用随机抽样的方法对140名健康成年男性血清尿素氮(BUN)浓度进行了检测,资料如下,请描述男性血清尿素氮的情况。˙表9-1的140个数据,无论多认真审视,也说不清这些女孩身高的情况怎样、特征如何˙统计描述就是解决此问题的方法,即
2、用统计表、统计图和统计指标来描述样本数据的特征6表9-1某地区140名健康成年男性血清尿素氮浓度(nmol/L)7一、数值变量资料的频数分布频数(frequency):变量值出现的次数,即例数频数表(frequencydistributiontable):反映变量值与频数之间关系的统计表8表9-2某地区140名健康成年男性血清尿素氮浓度(nmol/L)频数表9频数表的制作步骤:1.计算极差(range):本例R=6.55-2.10=4.45(nmol/L)2.决定组数、组段和组距(取方便数)3.列表划记:见表9-2。10表9-2某地区140名健康成年男
3、性血清尿素氮浓度(nmol/L)频数表11从频数表可看出有两个重要的特征:①集中趋势(centraltendency):多数数据向中间集中②离散趋势(tendencyofdispersion):少数数据向两端分散12(二)频数分布图(直方图)及其制作频数分布图:反映变量值与频数之间关系的统计图(直方图)。将表9-2资料绘制成频数分布图(图9-1),可见图形中间高两边低、两边对称,认为近似服从正态分布。1314(三)频数表与频数图比较频数表不够直观,但读出数据精确频数图比较直观,但读出数据不精确15(四)分布类型简述正态分布:图9-1可称为正态或近似正态
4、分布(后述)对数正态分布:指数据的对数值呈正态分布偏态分布:若高峰位于一侧,便被称之为偏态分布(高峰偏左为正偏态,反之为负偏态)分类意义:不同分布类型资料,其描述性统计方法不同(应对号入座)16图9-2频数分布逐渐向正态分布接近17二、平均水平指标平均数(average):描述数值变量资料平均水平(或集中趋势)的指标。平均数种类:算术平均数(简称均数)、几何平均数、中位数,另有众数以及调和均数。18(一)均数(mean)均数符号:总体均数为(读作mu),样本均数为1.直接法计算均数:(9-1)为求和的符号,读作sigma,xi为观察值,n为例数【例
5、9-2】10名女孩的身高(cm)的平均值为142.2(cm)192.加权法计算均数加权法(频数表法)基本思想:以组中值代表组内的变量值(近似法),简化计算计算:表9-3中fixi=616.80,fi=140,得(9-2)(nmol/L)20【注】直接法计算得均数为4.38(nmol/L),可见加权法近似效果很好。21(二)几何均数(geometricmean)定义:是将n个观察值x的乘积再开n次方,所得的平方根,记为G适用情形:(1)观察值呈倍数关系(等比级数资料)或近似倍数关系,如抗体滴度;(2)对数正态资料。221.直接法:23【例9-3】8份
6、血清的抗体效价为1:200,1:25,1:400,1:800,1:50,1:100,1:50,1:25平均抗体效价为=lg-12=100即1:100242.加权法:(9-4)25例9-4112名儿童接种疫苗一月后的血清抗体效价为:1人1:4,3人1:8,15人1:16,32人1:32,43人1:64,11人1:128,5人1:256,2人1:512,得即这112名儿童的血清平均抗体效价为1:4826【注】计算几何均数的观察值不能小于或等于0,因为无法求对数。先加上一常数即可,如X’=K+X,则X’可取对数。最终的几何均数结果:G=G’-K27(三)中位
7、数(median)与百分位数(percentile)中位数:一组观察值按大小顺序排列,位置居中的那个数值称为中位数,记为M。百分位数:一组数据从小到大排列,并分成100等份,第x等份之分割位置的数值称为第x百分位数,记为Px例如:x=50,记为P50,读作“第五十百分位数”(即中位数)28适用情形:适用于任意分布,常用于:①偏态分布(如发汞、尿铅);②一端或两端无确定数值;③分布情况不明。29常用百分位数:P50,P25,P75,,P5,P95,P2.5,P97.5怎样求解中位数和百分位数?301.中位数的直接估计:①n为奇数时,正中位置的数值就是M;
8、M=X(n+1)/21,2,6,10,19②n为偶数时,居中位置两个数值的平均数就是M。M=[
此文档下载收益归作者所有