01 流行病学统计基本概念.pdf

01 流行病学统计基本概念.pdf

ID:48038104

大小:450.98 KB

页数:9页

时间:2020-02-06

01 流行病学统计基本概念.pdf_第1页
01 流行病学统计基本概念.pdf_第2页
01 流行病学统计基本概念.pdf_第3页
01 流行病学统计基本概念.pdf_第4页
01 流行病学统计基本概念.pdf_第5页
资源描述:

《01 流行病学统计基本概念.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、流行病学统计基本概念数据(Data)变量(variable):o分类变量(categoricalvariable):无序分类变量;有序分类变量o连续性变量(continuousvariable):总体(population)与样本(sample)变量的分布及其描述o分类型变量分布描述o连续性变量分布描述集中趋势与离散趋势描述集中趋势的指标:均数,几何均数,中位数描述离散趋势的指标:方差(Variance)、标准差(Standarddeviation),极差(Range),四分位数间距(Quartilerange),百分位数总体均

2、数的可信区间效应估计线性回归与Logistic回归数据(Data):对一组观察对象进行观测,记录若干个观测指标值,将每个观测个体每个观测指标的观测值整理成行乘列表的形式。每行表示每个观测个体,每列表示每个观测指标(又称变量或字段)。数据文件格式:文本文件格式:行间有行分隔符,列(字段)间分隔符常用:制表符、或逗号、或空格。Excel文件:特定的数据文件格式:如R数据文件、SAS数据文件。EmpowerStats《易尔统计》可直接读取文本文件格式、Excel文件格式的数据文件。变量(variable):变量,是指没有固定的值。从一个总体

3、人群中随机抽取一个个体进行观测(如测量身高),这个观测值是随机的、可变的(再抽取一个个体观测的结果很可能不同)。分类变量(categoricalvariable):其变量值是定性的,表现为互不相容的类别或属性,如性别。分类变量可分为无序变量和有序变量两类。无序分类变量(unorderedcategoricalvariable)是指所分类别或属性之间无程度和顺序的差别。,它又可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(O、A、B、AB等。有序分类变量(ordinalcategoricalvariable

4、)各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。连续性变量(continuousvariable):在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。如身高、体重。总体(population)与样本(sample)统计的过程是从样本(sample)推断总体(population)的过程。总体是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。样本是按照随机化原则,从总体中抽取的有代表

5、性的部分观察单位的变量值的集合。变量的分布及其描述统计分析的一个基本步聚是对一个样本中的某观测变量的频数分布进行描述,推断总体的该变量的分布情况。分类型变量分布描述:统计各组频数,计算各组所占的百分数。如:性别人数(百分数)男417(50.1%)女415(49.9%)连续性变量分布描述:首先根据变量的取值范围,等分成7-9组,统计落在每组内的观测数,绘制频数表与直方图。例图:上图中,横轴表示连续性变量取值(身高),直条的面积表示频数。从图上可以看出连续性变量分布的两个基本特征:(1)频数分布有向中间集中的趋势,称集中趋势;(2)频数分布向

6、两侧逐渐减少,称离散趋势。描述集中趋势的指标:1.均数:又称算术平均数,即所有观测数值的平均数。适用于对称性的分布。2.几何均数:将所有观测数值取对数后再求平均数,然后对该平均数取反对数。适用于对数正态分布。3.中位数:将所有观测数值从小到大排列,位于中间的数。适用于对称或偏态分布资料。对于完全对称的或正态的分布资料,理论上中位数与均数相等。描述离散趋势的指标:1.方差(Variance)、标准差(Standarddeviation):方差是各个数据与平均数之差的平方的平均数。用来度量随机变量和其数学期望(即均值)之间的偏离程度。标准差是

7、方差的平方根。2.极差(Range):是最大值减最小值。适用于对称或偏态分布资料。3.四分位数间距(Quartilerange):所有观测值从小到大排列后,第75百分位数(P75)与第25百分位数(P25)的差。适用于对称或偏态分布资料。4.百分位数:将所有观测值从小到大排列后,位于第X百分位上的数叫第X百分位数(Px)。中位数即第50百分位数(P50)。同理,最小值即P0,最大值即P100。总体均数的可信区间:样本是从总体里抽样出来的。由样本可以计算均数(A)、标准差(SD)。假设每次抽样样本量为n,重复M次抽样,得样本均数A1,A2,

8、……,Am。这M个样本均数都是对总体均数的估计。这M个样本均数互不相同,也可以计算出一个标准差,称样本均数的标准误(Se)。实际工作中,我们不可能作M次抽样,无法直接得到M个样本均数A1,A2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。