卫生统计学复习资料.doc

卫生统计学复习资料.doc

ID:57928986

大小:170.50 KB

页数:17页

时间:2020-04-04

卫生统计学复习资料.doc_第1页
卫生统计学复习资料.doc_第2页
卫生统计学复习资料.doc_第3页
卫生统计学复习资料.doc_第4页
卫生统计学复习资料.doc_第5页
资源描述:

《卫生统计学复习资料.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、科研方法第三章实验设计的基本要素:实验设计的基本要素包括处理因素、受试对象和实验效应三个组成部分。实验设计的四原则:对照原则均衡原则随机原则重复原则随机原则:使实验组和对照组非处理因素趋于一致或均衡的主要手段是随机化。随机化的方法有多种,最常使用的是利用随机数字表和随机排列表(或称随机化分组表)。拉丁方设计:用r个拉丁字母排成r行r列的方阵,使每行及每列中每个字母都只出现一次,这样的方阵称为r阶拉丁方,或r×r拉丁方正交设计正交设计:正交设计是一种高效、快速的多因素试验方法。它是利用一套规格化的正交表,使每次试验的因素及水平得到合理安排,通过试验结果的分析,获得有用的信息。除了分析主因素

2、外,还可分析交互作用。非条件logistic回归的公式,目的,用途统计学第一章统计学家用总体这个术语来表示大同小异的对象全体。我们试图就某个总体下结论,这个总体便称为目标总体。资料常来源于目标总体中的一个部分,它称为研究总体。科学的办法是从研究总体中抽取少量有代表性的个体,称为抽样。一些个体处于同一总体,就是指他们大同小异,具有同质性。同一总体内的个体间存在差异又是绝对的,这种现象称为变异。本书把变量分成定性与定量两种类型。定性变量中最常见的是分类变量或名义变量。最简单也最常用的分类变量是二分类变量。另一类定性变量是有序变量或等级变量。定量变量可以分为两种类型,离散型变量和连续型变量。离

3、散型变量只能取整数值。连续型变量可以取实数轴上的任何数值。变量只能由“高级”向“低级”转化:定量→有序→分类→二值;不能作相反方向的转化。在定量变量中,离散型变量常常通过适当的变换或连续性校正后借用连续型变量的方法来分析。理论上,正态分布有两个参数:总体均数和总体方差。这种由观察资料计算出来的量称为统计量。第二章对连续型定量变量,频率分布表的编制步骤如下:(1)计算极差(R),也称为全距,即数据最大值与最小值之差。(2)确定组段数与组距,变量值个数较多时,组段数一般取10左右。每个组段的起点称为组段的下限,终点称为组段的上限,组距为上下限之差,按“组距≈R/预计的组段数”来估计。(3)确

4、定各组段的上、下限,分组时,第一组段应包含最小值,为了计算方便,组段下限一般取较整齐的数值。最后一个组段应包含最大值,在确定各组段的上下限,注意各组段要连续但不能重叠,故除最后一个组段外,其余组段应包含其下限值,不包含其上限值。(4)列表直方图(频率直方图),其横轴为血清铁含量,纵轴为频率密度,即频率/组距(直条面积等于相应组段的频率)。在组距相等时,直方图中矩形直条的高度与相应组段的频率成正比。可以看到,直方图的面积之和等于1,。其值的分布具有对称的特点,这类分布常被称为对称分布。频率分布是不对称的,这类分布称为偏峰分布。一般称这种峰向左侧偏移的分布为正偏峰分布。而峰向右侧偏移的分布称

5、为负偏峰分布。集中趋势与离散趋势,集中趋势与离散趋势同时存在,是总体分布的两个重要特征,描述集中趋势和离散趋势可较全面的反映所研究的变量。1.算术均数(mean),算术均数简称均数,总体均数用希腊字母μ表示,样本均数用表示。(1)直接法:计算公式为:其中n为样本含量,X1,X2,…,Xn为观察值。大写的希腊字母Σ(读作sigma)。(2)频率表法:计算公式为:其中f为各组段的频数,X0为各组段的组中值,X0=(组段上限+组段下限)/2。各组段的频数在这里起了“权数”的作用,各组段的频率(f/n)称为权重系数。故频率表法也称加权法。2.几何均数G,几何均数适用于原始观察值分布不对称,但经对

6、数转换后呈对称分布的资料,如对数正态分布资料。(1)直接法:计算公式为:(2)频率表法:3.中位数(M),中位数是指将原始观察值从小到大或从大到小排序后,位次居中的那个数。(1)直接法:样本量n为奇数时n为偶数时其中表示将n例观察值从小到大排列后的第i个顺位的观察值。百分位数(Px)是一个数值,它将原始观察值分成两部分,理论上有x%的观察值小于Px,有1—x%的观察值大于Px。百分位数P50就是中位数。对频率表资料,百分位数Px的计算公式为:其中L为欲求的百分位数所在组段的下限,i为该组段的组距,为截止至L的累计频数,为截止至L+i的累计频数,—为该组段内的频数,n为总频数。4.众数,众

7、数原指总体中出现机会最高的数值。同一总体中不同个体间存在的差异称为变异。1.极差(R),也称全距,定义为最大值与最小值之差,极差越大意味着数据越离散,或者说数据间变异越大。2.四分位数间距(Q),百分位数P75和百分位数P25分别称为上四分位数和下四分位数。四分位数间距表示百分位数P75和百分位数P25之差,定义为Q=P75-P25。同类资料比较,Q越大意味着数据间变异越大。四分位数间距可用于各种分布的资料,特别对偏锋分布资料,常把

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。