数据特征与统计描述

数据特征与统计描述

ID:27675547

大小:1.08 MB

页数:105页

时间:2018-12-05

数据特征与统计描述_第1页
数据特征与统计描述_第2页
数据特征与统计描述_第3页
数据特征与统计描述_第4页
数据特征与统计描述_第5页
资源描述:

《数据特征与统计描述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章数据特征与统计描述第一节频数分布表与频数分布图第二节计量资料的常用统计指标第三节计数资料的常用统计指标第四节统计图表本章结构第一节频数分布表与频数分布图一、频数分布表(frequencytable)用途:用于描述资料的分布特征 频数:在一批样本中,相同情形出现的次数称为该情形的频数。资料类型组段频数计数和等级观察结果的所有分类相同类别出现的次数计量根据观察结果重新划分分组统计P44表4-1,4-2,4-3表4-3某地150名正常成年男子红细胞数(1012/L)编号红细胞数编号红细胞数13.98……24.541434.6734.741445.4045.1

2、31455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.191.频数表的编制步骤(1)求极差(range):即最大值与最小值之差,又称为全距。本例极差:R=5.88-3.79=2.09(1012/L)(2)决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分10-15个组,为方便计,组距参考极差的十分之一,再略加调整。本例i=R/10=2.09/10=0.209≈0.2。(3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。

3、(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。组段(1)频数,f(2)组中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9合计15.85.8150719.8三、频数分布图P47二、频数表和频数分布图用途1.描述频数分布的类型*(1)对称分布:若各组段频数的分布以频数最多的组段为中心

4、左右两侧大体对称(总体则完全对称),就认为该资料是对称分布(图4-2)(2)偏态分布:右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。表4-115名正常成年女子血清转氨酶(mmol/L)含量分布左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。表4-101名正常人的血清肌红蛋白()含量分布2.描述计量资料分布的集中趋势和离散趋势①集中趋势(centraltendency):变量值集中位置。本例在组段“4.7~”。——平均水平指标②离散趋势(tendencyofdispersion):变量

5、值围绕集中位置的分布情况。离“中心”位置越远,频数越小;且围绕“中心”左右对称。——变异水平指标3.便于发现一些特大或特小的可疑值*4.便于进一步做统计分析和处理第二节计量资料的常用统计指标描述集中趋势的特征数描述离散趋势的特征数计量资料(定量资料、数值变量资料)总体:有限或无限个(定量)变量值样本:从总体随机抽取的n个变量值:X1,X2,X3,……,Xnn为样本例数(样本大小、样本含量)一、描述集中趋势的特征数(平均指标)总称为平均数(average)反映了资料的集中趋势(centraltendency)。常用的有:1.算术均数(arithmeticmea

6、n),简称均数(mean) 2.几何均数(geometricmean) 3.中位数(median)均数(mean)Σ为求和符号,读成sigma,k,X,f意义例4-2“权数”例4-3符号:总体样本 适用条件:资料呈对称分布,尤其是正态或近似正态。计算:(1)直接法(2)频数表法p49,例4-3:均数=719.8/150=4.82.几何均数(geometricmean)几何均数:变量对数值的算术均数的反对数。几何均数的适用条件与实例适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料例血清的抗体效价滴度的倒数分别为:10、100、1000

7、、10000、100000,求几何均数。此例的算术均数为22222,显然不能代表滴度的平均水平。同一资料,几何均数<均数频数表资料的几何均数抗体滴度⑴人数,f⑵滴度倒数,X⑶lgX⑷f·lgX⑸1:41:81:161:32┇1:512合计1562┇572481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471p51,例4-5:几何均数=反对数(72.2471/40)=64.003.中位数(median)意义:中位数是将一批数据从小至大排列后位次居中的数据值

8、,反映一批观察值在位次上的平均水平。符号:Md适用条

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。