欢迎来到天天文库
浏览记录
ID:62137177
大小:3.45 MB
页数:126页
时间:2021-04-18
《最新数值变量的统计描述(临本)教学讲义ppt.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数值变量的统计描述(2013临本)一、数值变量的频数分布表与频数分布图在医学研究工作中,所收集到的原始数据一般是无规律所循的,特别当观察值较多时,直接从原始数据很难得出概括的印象。必须通过资料清理,编制频数表,来显示数据分布的范围、数据最集中的区间和频数分布的形态等。第一节集中趋势和离散趋势的统计描述例15.1测定了110例正常人血铅含量(μg/L),见下表。血铅含量0-4-8-12-16-20-24-28-合计频数1423301914613110广西人均卫生事业费在全国位次(1998年)1999年中国农村死亡原因构成(%)计量资料是连续性的资料,我们可把该组数据
2、范围大小分成若干段,然后再统计各段的频数,并用表格来表示,即称为计量资料的频数分布表。(一)频数分布表的编制最小值最大值个数:28152516742计量资料的频数表:即按数量大小分组,然后再清点各组(段)的个数(一)频数分布表的编制(1)求全距R=最大值-最小值=104.8-80.1=24.7例15.1150名3岁女孩身高值(cm)。编制步骤:计量资料的频数表:即按数量大小分组,然后再清点各组(段)的个数R最小值最大值(2)划分组段②求组距(i):i=极差/组数=24.7/10=2.47≌2.5①确定组数原则:n<50,5-8组;n>50,9-15组。实际应用时,
3、应根据研究目的和分析要求,灵活确定组数。一般以能反映频数分布的特征为原则。③确定各组段的上下限原则:第一组段包括最小值,最后组段包括最大值。每一组段都有上限和下限下限:组段的起点(最小值)上限:组段的终点(最大值)一般只列出下限!80.1104.8组距⑶组距=极差/组数(拟采用等距分组)24.7⑵确定组数:拟分几个组?(一般10组)⑴求全距:线段的长度⑷定组段:划范围⑸统计各组段的人数:下限上限(下组段的下限)编制步骤:读取数据,然后“对号入座”划记80.1100.1频数表的用途:1.描述频数分布的类型和特征DescriptiveStatistics频数分布表(
4、frequencytable)2.便于发现一些特大或特小的可疑值3.便于进一步做统计分析和处理(二)频数分布的特征1、集中趋势(centraltendency):数据向某一数值集中的倾向(中等身高[92-94cm]的人数最多)2、离散趋势(tendencyofdispersion):数据的数值大小不等的倾向(由中间向两侧逐渐减少)集中趋势离散趋势离散趋势(三)频数分布的类型正态、对称分布偏态分布正偏态负偏态频数分布图以观察变量(组段)为横轴,频数或频率为纵轴绘制统计图。可直观地反映频数分布的特征。对称分布示意图正态分布示意图可以是多峰,只要左右对称只能是单峰二集中
5、趋势的描述描述计量资料分布特征的指标集中趋势指标离散趋势指标平均数(average)R、Q、S、CV常用平均数的种类:1、算术均数(arithmeticmean)(简称均数,mean)2、几何均数(geometricmean)3、中位数(median)(一)算术均数(均数)样本均数用X表示,总体均数用μ表示.1、适用范围对称分布,尤其是正态分布的资料2、计算方法:(1)直接法例有10人身高值:92.5,82.5,…,95.1求平均身高。(2)加权法f为相同观察值的个数(频数)例:2,3,3,4,4,4,5,5,5,6求均数。方法一:方法二:直接法加权法加权法用于频
6、数表资料其中:X=组中值=(上限+下限)/2f=频数为什么用组中值?问题:所有的频数表资料计算均数都需要用组中值计算吗?3、均数的应用⑴反映一组观察值的平均水平⑵描述正态分布特征的重要参数原始数据的分布为偏态分布,但经对数变换后的分布呈正态分布(二)几何均数(geometricmean,简记为G)1、适用资料:对数正态分布资料(血清抗体滴度资料)(微量元素资料)xlgxlgx2、计算方法:(1)直接法G=lg-1设:(正态分布)(求均数)(还原)例15.21:10,1:100,1:1000,1:10000,1:100000,求平均血清抗体效价。该5人的平均血清效价
7、为1:1000。注:用抗体倒数直接计算。(2)加权法G=log-1抗体滴度资料的计算:不用组中值计算其中:X=组中值=(上限+下限)/2f=频数为什么?不需计算组中值,为什么?例15.33、应用几何均数注意事项:(1)观察值不能有0;(2)观察值不能同时有正负值,若全部为负值,可按正值先求,然后加上负号;(3)同一资料求得的G<(三)中位数(M)和百分位数(Px)1、定义中位数:将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数。在全部观察值中,大于和小于中位数的观察值的个数相等。M50%50%百分位数:将一组观察值从小到大按顺序排列,一个百分位数将全部观
8、察值分为两
此文档下载收益归作者所有