第二章数值变量的描述性统计

第二章数值变量的描述性统计

ID:20848013

大小:2.38 MB

页数:88页

时间:2018-10-17

第二章数值变量的描述性统计_第1页
第二章数值变量的描述性统计_第2页
第二章数值变量的描述性统计_第3页
第二章数值变量的描述性统计_第4页
第二章数值变量的描述性统计_第5页
资源描述:

《第二章数值变量的描述性统计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数值变量的描述性统计山东大学公共卫生学院2主要内容§2.1频数分布§2.2集中趋势§2.3离散趋势§2.4正态分布及其应用3§2.1频数分布频数分布表的概念频数分布表的编制方法频数分布的特征频数分布的类型频数分布表的用途4例2.1某地2004年抽样调查100名男大学生的身高(cm)1075一、频数分布表的概念当样本含量n较大时,为了解样本中观察值的分布规律和便于指标计算,可编制频数分布表,简称频数表(frequencytable)。频数:对某一随机现象进行重复观察,或测量大量个体的某项特征,其中某个或某一组变量值出现的次数。频数表:将各变量值与其相应的频数列成表格形式即为频数表。6

2、二、频数表的编制编制频数表时不可能把所有的变量值及其相应频数都列出来,特别是当样本例数n较大时,此时需要根据变量的取值范围划分为若干个组段,再汇总各组段的频数。具体步骤如下:以例2.1资料为例。7全距(或极差,range)是最大值与最小值之差,用R表示。例2.1中,最大值为183.5cm,最小值为162.9cm,故R=183.5-162.9=20.6(cm)。1.求全距数值变量资料频数表的编制8组段数:根据样本含量的多少确定,一般设8~13个组段。组距:各组段的起点和终点分别称为下限和上限,相邻两组段的下限之差(或每一组段的上、下限之差)称为组距。一般取等距分组,常用全距的1/10

3、取整做组距。某组段(下限+上限)/2为组中值。划分组段:各组段应是连续的,不能有交叉或重叠。第一组段应包括最小值;最末组段应包括最大值,并同时写出其下限与上限。例2.1中,全距的1/10为20.6/10=2.06,组距取整为2.0cm;最小值为162.9cm,故第一组段的下限为162cm,第二组段的下限为164cm,依次类推,最末组段为182cm184cm,包含最大值183.5cm。2.确定组段和组距数值变量资料频数表的编制93.列出频数表采用计算机或划记法将原始数据汇总,得出各组段的观察例数,即频数,把各组段(或各观察值)及其相应的频数列表即为频数表。注意:最末组段应写出上、下

4、限,其余组段只包含下限,不包含上限。数值变量资料频数表的编制102011三、频数分布的特征频数分布的两个重要特征:1.集中趋势(centraltendency):身高向中央部分集中,以中等身高居多(172cm组段),此为集中趋势。反映集中位置或平均水平。2.离散程度(tendencyofdispersion):由中等身高到较矮或较高的频数分布逐渐减少,反映了身高的离散程度。对于数值变量资料,应用集中趋势和离散程度二者结合起来分析其分布规律。12图某地100名18岁男大学生身高的频数分布集中趋势离散程度4513四、频数分布的类型对称分布:指频数分布的集中位置在中间,左右两侧大致对称

5、。偏态分布:指频数分布不对称,集中位置偏向一侧:集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。如有害化学物质在正常人体内的分布为正偏态分布;冠心病、大多数恶性肿瘤等慢性病患者的年龄分布为负偏态分布。不同的分布类型应选用不同的统计分析方法。14图2-1某地100名18岁男大学生身高的频数分布15五、频数表的用途频数表可以揭示资料分布类型和分布特征,以便选取适当的统计方法;便于进一步计算指标和进行统计分析;便于发现资料中的某些特大或特小的可疑值。当样本含量特别大时,可以频率估计概率。作为资料的陈述形式。在文献报告中,用频数表既可直观地反映被研究事物

6、的分布特征,又便于作进一步的分析研究。16§2.2集中趋势平均数是一类用于描述数值变量资料集中趋势的指标,反映一组同质观察值的平均水平或中心位置。统计上的平均数包括均数、几何均数、中位数、众数、调和均数等。17一、均数均数(mean)是算术均数(arithmeticmean)的简称。定义:指所有观察值的代数和除以观察值的个数。符号:样本均数用表示,总体均数用(miu)表示。应用:用于反映一组同质观察值的平均水平,应用甚广。适用于正态或近似正态分布的数值变量资料。计算方法:直接法加权法18直接法:用于样本含量n较小时,公式为:式中,希腊字母(sigma)表示求和;为各观察值;n为样本

7、含量,即观察值的个数。例2.2某地随机抽取10名18岁健康男大学生身高(cm)分别为168.7,178.4,170.0,170.4,172.1,167.6,172.4,170.7,177.3,169.7,求平均身高。集中趋势的描述指标---均数---直接法(cm)19加权法:用于频数表资料或样本中相同观察值较多时,其公式为:例2.3计算例2.1表2-1资料100名男大学生的平均身高。集中趋势的描述指标---均数---加权法该100名18岁健康男大学生身高的均数为172

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。