广义多元线性模型

广义多元线性模型

ID:42034744

大小:811.98 KB

页数:15页

时间:2019-09-05

广义多元线性模型_第1页
广义多元线性模型_第2页
广义多元线性模型_第3页
广义多元线性模型_第4页
广义多元线性模型_第5页
资源描述:

《广义多元线性模型》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、数据分析基础广义多元线性回归方程的构建广义多元线性回归方程的构建【文献回顾】这是一篇2014年发表在新英格兰医学杂志(影响因子55.8分)的论文[1],研究妊娠期是否能用抗抑郁药,结果表明妊娠初期使用抗抑郁药不显著增加新生儿心脏畸形。(CONCLUSIONSTheresultsofthislarge,population-basedcohortstudysuggestednosubstantialincreaseintheriskofcardiacmalformationsattributabletoant

2、idepressantuseduringthefirsttrimester.)文章统计学方法部分开篇写到:统计学方法里写到的独立作用的风险(absoluterisk)是什么?是如何通过回归分析(Logistic-regressionanalysis)得出的?为什么要这样做?是怎么用软件实现的?上述问题,将在本篇中讲解。广义多元线性回归方程的构建【概念】这里指的多元线性模型,是广义线性模型,应变量(Y)的分布类型可以是:正态分布(gaussian)、两分类分布(binomial)、泊松分布、负二项分布等,不同

3、的分布类型对应不同的联系函数f(Y)。f(Y)=β0+β1*X1+β2*X2+β3*X3+β4*X4+……【用途】广义线性模型有两大常用用途:1.危险因素分析:评价某危险因素(X)对结果变量(Y)有没有独立作用及独立作用的大小的是多少。(最常见)2.建立预测模型:从一系列X1、X2、…中挑选出一个最佳预测模型预测Y的发生。需要注意的是用途不同,构建模型的方法完全不同,对模型的解读完全不同。很多人对此不甚理解,常常用一种逐步回归方法构建危险因素分析的模型,对结果也不知道怎么解读,有很多混淆。这个教程的目的旨在

4、帮助大家理清这个问题。流行病学分析是为了确定危险因素与结果变量之间是否有联系,危险因素对结果变量的作用大小(即效应)。表1效应的估计和结果变量与危险因素的类型结果变量(Y)危险因素(X)效应测量统计检验连续性,分类型,吸烟者与不吸烟者收缩压的差(β)H0:β=0如收缩压如是否吸烟及其标准误连续性,连续性,BMI每增加一个单位SBP增加多少H0:β=0如收缩压如体重指数(β)及其标准误分类型,分类型,吸烟者与不吸烟者高血压发生率比H0:OR=1如是否高血压如是否吸烟(OR)及其95%可信区间分类型,连续性,B

5、MI每增加一个单位高血压发生率比H0:OR=1如是否高血压如体重指数(OR)及其95%可信区间广义多元线性回归方程的构建【独立作用】广义多元线性模型的第一大用途是在危险因素研究中,得出独立作用。什么是独立作用?为什么要评价独立作用呢?如研究肥胖与高血压关系,比较论文中可能的几种结论:1.胖子与瘦子相比,收缩压有显著差别(P<0.005)。这个结论是用t检验比较两组均数得出的。这有没有说清楚呢?没有。2.体重指数与收缩压,非常显著相关(P<0.0001)。这是用相关分析做的。这有没有说清楚呢?也没有。3.体重

6、指数每增加1kg,收缩压增加0.01mmHg,P<0.00001。这是用回归方程做出来的。统计上非常显著。它也告诉我们,每降低体重1公斤,能降低血压0.01mmHg,这个0.01就没有临床意义了,因为控制体重能导致的降压幅度太小。另外这个0.01里面有没有其它因素的作用在内呢?不知道。4.在控制了其它因素的作用下,体重指数每增加1kg,收缩压增加1mmHg,95%可信区间0.7-1.3mmHg。根据可信区间知统计上显著。而且每降低体重1公斤,能降低血压1mmHg,有临床应用价值。这个结果是用多元回归方程做出

7、来的,控制了其它因素的作用,得出的回归系数1mmHg是体重指数对收缩压的独立作用。可以想象当临床上遇到一个高血压并肥胖的病人,根据这个结果就可以告诉他仅降低体重这一项就能降低血压多少,如果病人又吸烟又饮酒,可根据相应的文献告诉他,如果戒烟又能降低血压多少,戒酒又能降多少,这就是临床价值的体现。比较这些结论,理解统计意义与临床意义的关系,从而理解如何提高一篇论文的科学价值。上面这些结论中,有t检验得出的、相关分析得出的、回归分析得出的。回归分析,给出有临床意义的回归系数,而且可以控制其它因素,分析X对Y的独立

8、作用,掌握回归分析非常必要。广义多元线性回归方程的构建如何通过回归分析来评价独立作用?举例:比较吸烟与身高的关系看图知吸烟者比不吸烟者高。单因素回归分析得出方程:Height=1.563+0.092*Smoke回归系数为0.092,即吸烟者比不吸烟者高9.2cm,P值小于0.001。那是不是就可以说吸烟影响身不吸烟组吸烟组高呢?再看看进一步的分析:图1按吸烟情况分组身高的箱图按性别分开:男性身高比女性高;男性里,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。