冠心病与年龄

冠心病与年龄

ID:39072480

大小:435.50 KB

页数:8页

时间:2019-06-24

冠心病与年龄_第1页
冠心病与年龄_第2页
冠心病与年龄_第3页
冠心病与年龄_第4页
冠心病与年龄_第5页
资源描述:

《冠心病与年龄》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、10.6冠心病与年龄问题冠心病(CoronaryHeartDisease,简称CHD)是一种常见的心脏疾病,严重地危害着人类的健康。到目前为止,其病因尚未完全研究清楚,医学界普遍认同的、重要的易患因素是、高血脂、高血压、糖尿病、动脉粥样硬化及家族史等。多项研究表明,冠心病发病率随着年龄的增加而上升,在冠心病的流行病学研究中,年龄也是最常见的混杂因素之一。为了更好的说明冠心病发病率与年龄的关系,医学家们对100名不同年龄的人进行观察,表1中给出了这100名被观察者的年龄及他们是否患冠心病的数据(其中冠心病一栏中,1代表被观察者患冠心病,0代表不患冠心病)。本节的目的是根据这些数据建立数学模

2、型,来分析冠心病发病率与年龄的关系,并进行统计预测。表1100名被观察者的年龄与是否患冠心病的观察数据序号年龄冠心病序号年龄冠心病序号年龄冠心病序号年龄冠心病12002635051441765512230273505244177561324028360534507856142502936154451795615251303605546080570626031370564618157072603237157470825718280333705847083571928034380594718457110290353806048085571113003639061481865801230037

3、3916248187581133003840063490885811430039401644908959115300404106549190591163014141066500916001732042420675019260118320434206851093611193304442069520946212033045421705219562121340464307153196631223404743072531976402334148431735419864124340494407455099651253405044075551100691分析与假设假设这100名被观察者是独立选取的,

4、记x为被观察者的年龄,Y为被观察者患冠心病的情况(Y=1表示患冠心病,Y=0表示未患冠心病),显然Y是一个0—1变量。利用表1的数据作出Y对x的散点图(见图1)。从图1容易看出,直接对上述数据建立像前面几节那样的回归模型是行不通的,需要对数据进行预处理。数据预处理的一种方法是将被观察者按年龄进行分组,并统计各年龄段中患冠心病的人数,及患病人数占该年龄段总人数的比例(以下简称患病比例)。为方便起见,我们将年龄分成8个年龄段,分段后的数据见表2。表2各年龄段的冠心病人数及比例年龄段年龄段中点人数患冠心病人数患病比例20~2924.51010.130~34321520.1335~3937123

5、0.2540~44421550.3345~49471360.4650~5452850.6355~595717130.7660~6964.51080.80合计100430.43为考察患病比例与年龄的关系,首先根据表2数据做出患病比例对各年龄段中点的散点图(见图2,为方便起见,散点的横坐标均简单地取各年龄段的中点)。从图2可以看出,冠心病患病比例随年龄的增大而递增,大致是一条介于0与1之间的S型曲线,这条曲线应该怎样用回归方程来确定呢?表1和表2中的患病比例实际上就是年龄为x时(以下均取年龄段的中点)Y的平均值,用(条件)期望的符号记作y=E(Y

6、x)(1)患病比例y是年龄x的函数,其取值在

7、区间上。如果用普通的方法建立回归方程,那么很容易求得其线性回归曲线或更接近与S型曲线的3次多项式回归曲线(分别见图3和图4),其回归模型的形式为y=(2)其中随机误差服从均值为0的正态分布,特别地,当时为线性回归模型。然而在这个问题中,(2)式回归方程中y的取值不一定在中,进一步说,即使y的值在中,由于在给定x时,误差项也只能取0,1两个值,显然不具有正态性,而且的方差依赖于x,具有异方差性,这些都违反了普通回归分析的前提条件。因此,当Y为一个二分类(或多分类)变量而不是连续变量时,用前几节介绍的基于最小二乘法的回归分析是不合适的,需要用到新的回归模型。logit模型下面用(x)表示年龄

8、为x的被观察者患冠心病的概率,即(3)显然Y的(条件)期望为E(Y

9、x)=(x),(条件)方差为D(Y

10、x)=由(1)式可知,(x)即为该年龄段的患病比例y.为了寻求患病比例(x)与年龄x之间、形如图2的S型曲线的函数关系,并注意到(x)在区间取值,可以建立如在第5章、第7章多次用到的logistic模型(4)(4)的反函数写作(5)(5)式左端可看作的交换,记作,称为模型或回归模型。当在取值时,取值为。在数据预处理上时,将被观察者

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。