欢迎来到天天文库
浏览记录
ID:43158818
大小:895.50 KB
页数:41页
时间:2019-10-01
《计量资料的统计描述(研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二讲计量资料的统计描述频数分布一、频数分布表(frequencytable)编制频数分布表可了解其分布的范围、数据最集中的区间以及分布的形态。例2-1从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇()的测量结果如下,试编制频数分布表。2.354.213.325.354.174.134.483.984.732.784.263.584.344.844.413.993.803.874.783.953.923.583.664.283.784.574.263.263.502.704.614.752.913.933.784.133.914.593.
2、264.193.002.684.524.913.843.683.184.833.873.953.914.524.285.133.274.154.554.803.414.123.954.065.715.265.253.985.033.513.863.023.704.174.954.153.254.363.294.333.633.303.755.084.533.923.583.843.603.194.504.505.353.514.063.073.553.964.593.524.834.233.57频数分布编制步骤如下:求极差(range,R):也称全距,即最大值和最
3、小值之差,本例R=5.71-2.35=3.36(mmol/L)。确定组段数和组距:组段数(10-15组)。组距可通过极差除以组段数求得,本例i=3.36/10=0.30。3.写出组段:每个组段的下限为L、上限为U,起始组段和最后组段应分别包含全部变量值的最小值和最大值,见表2-1第(1)栏。4.分组划记并统计频数:各组段的频数见表2-1第(2)栏,然后求频数合计,完成频数表。频数分布组段频数f组中值Xfxfx2(1)(2)(3)(4)=(2)×(3)(5)=(2)×(3)22.30~12.452.456.002.60~32.758.2522.692.90~63.0
4、518.3055.823.20~83.3526.8089.783.50~173.6562.0526.483.80~203.9579.00312.054.10~174.2572.25307.064.40~124.5554.60248.434.70~94.8543.65211.705.00~55.1525.75132.615.30~25.4510.9059.415.60~5.9015.755.7533.06合计101—409.751705.09频数分布二、频数分布图根据表2-1资料,以各组段血清总胆固醇含量为横坐标、频数为纵坐标,可绘制频数分布图(graphoffre
5、quencydistribution),频数分布图2-2频数分布图2-3频数分布2.描述频数分布的特征从表2-1可看出这些数据的分布特征有两点:①变异的范围在;②有明显的统计分布规律,数据主要集中在之间,尤以组段的人数最多,且上下组段数的频数分布基本对称。3.便于发现一些特大或特小的可疑值4.便于进一步做统计分析和处理集中趋势的描述集中趋势描述数据的集中位置和平均水平。常用指标:★算术均数★几何均数★中位数集中趋势的描述1、算术均数(Mean):适应于对称分布的资料。1)直接计算法:计算公式为式中X1,X2和Xn为所有观察值,n为样本含量,∑(希腊字母,读作sig
6、ma)为求和的符号。例2-1资料得:集中趋势的描述2)频数表法:计算公式为表2-1资料得:集中趋势的描述2.几何均数几何均数(geometricmean)可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。其计算公式为集中趋势的描述例2-4某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为,求几何均数。或故5份血清抗体效价的平均滴度为。集中趋势的描述对于频数表资料,几何均数的计算公式为例2-5,见表2-4资料.计算结果如下:集中趋势的描述3.中位数中位数(median)是将个变量值从小到大排列,
7、位置居于中间的那个数。适用范围:各种分布类型的资料(如是偏态分布资料和一端或两端无确切数值的资料。奇数:次居中的变量值偶数:次居中的两个变量值的均数。集中趋势的描述例:8名患者食物中毒的潜伏期分别为1,2,2,3,4,8,15,24小时,求其中位数。本例,为偶数,得集中趋势的描述4.百分位数百分位数(percentile)是一种位置指标,用来表示。一个百分位数将全部变量值分为两部分,在不包含的全部变量值中有的变量值比它小,变量值比它大。故百分位数是一个界值,其重要用途是确定医学参考值范围(referencerange)。中位数实际上是第百分位数。集中趋势的描述百
8、分位数的计
此文档下载收益归作者所有