欢迎来到天天文库
浏览记录
ID:54979068
大小:299.50 KB
页数:30页
时间:2020-05-07
《定量资料的统计描述讲义.ppt》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、定量资料的统计描述统计描述是统计分析的最基本内容,也是统计分析的重要一部分.在统计学中经常用统计指标和统计图表来揭示和反映原始资料的数量特征和信息.第一节频数分布表与频数分布图频数分布表用于反映各变量(观察单位的某种特征)值及其相应频数之间关系的一类表格,我们称之为频数表.这里频数指对一种变量在多个观察单位中进行多次观察,其中某一变量值重复出现的次数.不同的资料类型编制频数表难易程度不同,其中计数资料和等级资料比较简单,而计量资料相对较繁杂些.计量资料频数表的编制一般情况下,样本含量小于30的统计资料无须编制频数表,但对于大样本含量的资料,编制频数表有利于进
2、一步的统计分析、且频数表本身也具有统计描述的作用.编制频数表的步骤编制频数表步骤流程图举例说明计量资料频数表的编制过程步骤如下:R=160.8-129.4=31.4。组段数=10;组距=R/10=3.14≈30(cm);按要求确定每一组段上下限。分组统计每一组段的频数,编制频数表。计量资料频数分布表计量资料频数分布图频数分布表的用途揭示数值变量频数分布的类型和特征作为陈述资料的形式便于发现一些特大或特小的可疑值便于进一步的统计分析计量资料频数分布的类型和特征3、百分位数(percentile)与中位数(median)百分位数是一种位置指标,用符号Px表示常用
3、的百分位数有P2.5,P5,P25,P50,P75,P95,P97.5等,其中P25,P50,P75又称为四分位数。百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位结合使用,可更全面地描述资料的分布特征。中位数是一个特定的百分位数即P50,用符号M表示。把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。中位数理论上可用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资
4、料。其计算方法有直接法和频数表法两种。(2)频数表法当观察例数n较多时,可先编制频数表,再通过频数表计算中位数。公式为:M=Lm+i/fm(n×50%-ΣfL)例现有187例某种沙门氏菌食物中毒病人的潜伏期(小时),见表第(1)栏、第(2)栏,求中位数。M=12+12/70(187×50%-35)=22.0(小时)中位数M即第50百分位数P50,故百分位数Px的计算类似M,计算公式为:Px=Lx+i/fx(n×x%-ΣfL)例求上表资料的P2.5,P25,P75。本例n=187,因187×2.5%=4.675,187×25%=46.75,187×75%=14
5、0.25,结合表第(3)栏累计频数可知P2.5,P25,P75分别在“0--”,“12--”,“24--”组段内,P2.5=0+12/35(187×2.5%-0)=1.6(小时)P25=12+12/70(187×25%-35)=14.0(小时)P75=24+12/40(187×75%-105)=34.6(小时)第三节离散趋势的描述指标1、全距(range)计算公式为:R=Xmax–Xmin全距越大,说明变量的变异程度越大。其度量单位与原变量单位相同。2、四分位数间距(quartile)是一组数值变量值中上四分数(即P75,记为Qu)与下四分数(即P25,记为
6、QL)之差,用符号QR表示计算公式为:QR=P75-P25它一般和中位数一起描述偏态分布资料的分布特征。3、方差(variance)离均差平方和的算术平均数,即为方差。总体方差用符号σ2(σ读seigama)表示,样本方差用S2表示。计算公式分别为:4、标准差(standarddeviation)方差的平方根即为标准差。总体标准差用σ表示,样本标准差用S表示。计算公式分别为:
此文档下载收益归作者所有