欢迎来到天天文库
浏览记录
ID:37298557
大小:1.11 MB
页数:60页
时间:2019-05-21
《第2章 统计描述》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第二章第二章统计描述统计描述2.1定量资料的统计描述2.2定性资料的统计描述2.3常用统计图表计算机演示SPSS操作方法见教材附录ASPSS统计软件入门2.1定量资料的统计描述一、一、频数分布表频数分布表二、频数分布图三、定量数据描述指标频数分布表的意义频数分布表的意义频数频数((frequencyfrequency))::指在一个抽样资料中,指在一个抽样资料中,某变量值出现的次数,将各变量及其频数某变量值出现的次数,将各变量及其频数列于表内,称为列于表内,称为频数表频数表。。目的:通过频数表来描述资料的分布规律目的:通过频数表来描述资料的分布规律参见教材参见教材P15P15
2、:例题:例题22--11例1某农村地区1999年14岁女孩的身高资料如下,请编频数表和观察频数分布情况。表9-1频数表的编制方法:频数表的编制方法:⒈⒈计算全距⒉⒉定组距⒊⒊写组段⒋划⒋记表9-2图9-1通过频数表的观察,可以看出变量值的分布有2个重要特征集中趋势(centraltendency):指变量值的集中位置,数据较集中。离中趋势(tendencyofdispersion):指变量值围绕集中位置的分布情况。频数分布类型:频数分布类型:正态分布频数分布正偏偏态分布负偏三、定量数据描述指标描述变量值分布的集中趋势用平均指标,描述变量值分布的集中趋势用平均指标,常称平均数。
3、平均数反映一群变量值的平均常称平均数。平均数反映一群变量值的平均水平或集中位置,是统计中最重要和应用水平或集中位置,是统计中最重要和应用最广泛的统计指标。最广泛的统计指标。1.对称分布资料的描述㈠算术平均数㈠算术X㈡标准差与方差㈡标准差与方差SS、、SS22㈠算术平均数(arithmetic)●简称:均数(mean)●使用条件:数据分布比较均匀呈正态分布或近似正态分布●样本均数用符号:X表示●总体均数用符号:μ表示㈡㈡标准差和方差标准差标准差(standarddeviation)SD(standarddeviation)SD或或SS方差方差(variance)(varianc
4、e)SS22使用条件:反映正态分布或近似正态分布观察值的离散趋势及变异度。nn--11就是众所周知以后非常熟悉而经常用到的就是众所周知以后非常熟悉而经常用到的自由度(自由度(degreeoffreedomdegreeoffreedom)。)。用希腊字母表示:用希腊字母表示:νν[nju[nju:]:]μμ[mju[mju:]:]区别区别??得到如下的公式得到如下的公式::222∑(X−X)∑(X−X)(2-4)S=⇒S=n−1n−12.非对称分布资料的统计描述㈠中位数和百分位数㈠中位数和百分位数㈡四分位数间距㈡四分位数间距㈢其它指标㈢其它指标㈠中位数和百分位数㈠中位数和百分位
5、数MedianandPercentileMedianandPercentile●中位数简记:M,指一组观察值从大到小排序,位于中间的数就是中位数。百分位数简记:P,当P=M??x50●条件:当一组资料类型分布不清或明显偏态分布,分布的一端或两端无界时。●公式:略。。。。见教材P18解释:P=M50小大0255075100PPPPP0255075100M百分位数用Px表示中位数和百分位数应用⑴中位数用于任何分布,特别是偏态分布,一端和两端无确切数据。⑵百分位数用于非正态资料的医学参考值估计,要求样本量足够大。例2-5现有275例某种沙门菌食物中毒患者的潜伏期(h),其频数分布见
6、表2-2,分别求出P5和P95百分位数和中位数。㈡㈡四分位数间距(四分位数间距(quartilequartile用用QQ表示)表示)小大1255075100PPPPP1255075100QQLLQQUU下四分位数下四分位数上四分位数上四分位数QQUU––QQLL==四分位数间距四分位数间距四分位数间距的意义四分位数间距的意义::四分位数间距越大,变量值的变异四分位数间距越大,变量值的变异程度或离散程度越大。程度或离散程度越大。因为越靠近两端因为越靠近两端的百分位数越不稳定的百分位数越不稳定。常用于描述偏态。常用于描述偏态分布资料的离散程度指标。但未考虑每分布资料的离散程度指标
7、。但未考虑每个观察值的变异。个观察值的变异。㈢其它常用统计描述指标⑴几何均数⑷全距⑸变异系数⑴几何均数(⑴几何均数(geometricmeangeometricmean))●●条件:条件:用于原始数据分布呈偏态分布;少数数据偏大,数据呈倍数关系或等比数列。如:抗体的滴度、细菌的计数、传染病潜伏期或频数明显呈偏态,各观察值之间呈倍数变化。●计算方法:略。。。⑵众数⑶调和均数,略。。。⑷全距(⑷全距(rangerange):):意义:表示一组变量值的最大与最小值之差,反映样本变量值的全范围。条件:全距对变量
此文档下载收益归作者所有