[医学]logistic回归

[医学]logistic回归

ID:36205859

大小:548.00 KB

页数:52页

时间:2019-05-07

[医学]logistic回归_第1页
[医学]logistic回归_第2页
[医学]logistic回归_第3页
[医学]logistic回归_第4页
[医学]logistic回归_第5页
资源描述:

《[医学]logistic回归》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Logistic回归Logistic回归分析的分类按数据的类型:非条件logistic回归分析(成组数据)条件logistic回归分析(配对病例-对照数据)按因变量取值个数:二分类logistic回归分析多分类logistic回归分析按自变量个数:一元logistic回归分析多元logistic回归分析线性回归模型和广义线性回归模型均要求因变量是连续的正态分布变量,且自变量和因变量之间呈线性关系。若因变量是二分类变量时,能不能建立多重线性回归呢?(二分类变量时取值为0和1)建立p(Y=1/X)与X的多重线性回归模型?(取值范围0~1)Lo

2、git(P)P考虑使用概率的logit变换函数非条件logistic回归的数学模型因此,我们使用P与(1-P)的比值的对数,来建立logit(P)与X的多重线性回归模型:优势:即一个事件发生的概率比上对立事件发生的概率(取值范围-∞~+∞)各种Logistic回归模型的形式:logistic回归的自变量自变量可以是连续型变量、分类变量或有序变量。如果是多分类变量,则需转化成哑变量来处理。参数估计采用极大似然法(maximumlikelihood,ML)进行回归系数的估计。极大似然法的基本思想是先建立似然函数或对数似然函数,求似然函数或对数

3、似然函数达到极大时参数的取值,即为参数的极大似然估计值。似然函数:现已出现的所有结局事件的概率乘积Logistic回归中的常数项(b0)表示,在不接触任何潜在危险/保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。Logistic回归中的回归系数(bi)表示,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即OR的对数值。系数的解释Wald检验——单个回归系数的假设检验Wald检验:用于检验单个回归系数有无统计学意义,计算简便,但结果较保守。大样本时,统计量服从卡方分布。拟合优度检验——检验模型是否拟合的

4、好L:似然函数LnL:对数似然函数,为负值-2LnL:正值,其值越小越好。如对应的P值不拒绝H0,则说明该模型拟合资料较好。似然比检验——比较两个模型哪个更优比较两个模型的-2LnL值之差:G=-2(lnL1-lnL2)G服从X2分布,自由度=两模型自变量个数差。判断在增加了自变量后,G的变化量是否有统计学意义,即此改善是否有意义。因此似然比检验也可用于对模型中的回归参数进行假设检验。似然比检验的结果比较稳健,因此使用更普遍。先做单因素分析:对连续变量先做两组频数分布,必要时转化成分类变量(考虑参数实际意义);对有序变量先做两组频数分布表

5、,必要时转化为无序分类变量(哑变量)或二分类变量;对可能相关的自变量进行部分多因素分析,考察自变量间的相关关系。建模策略建模策略在单变量分析和相关自变量分析的基础上,进行多因素逐步筛选;纳入模型的因素:单变量分析有统计学意义专业上有意义需要调整的混杂因素(始终放在模型中)在多因素筛选模型的基础上,考虑有无必要纳入变量的交互作用项。SAS中的LOGISTIC过程Proclogisticdescending;Model因变量=自变量表/selection=sle=sls=stb;Freq频数变量;Run;Proclogistic语句默认计算应

6、变量值最小(阴性结果---一般赋值为0)的概率,但是通常我们想要得到的是阳性结果的概率,即赋值最大的数值的概率(二分类变量时一般赋值为1),于是使用选项“descending”解决这一问题。Selection用于选择筛选自变量的方法,有backward(向后法)、forward(向前法)、stepwise(逐步法)、score(最优子集法)、none(完全法)五个选项,默认为none;SLE=概率值,入选标准,规定变量入选模型的显著性水平,前进法的默认是0.5,逐步法是0.15SLS=概率值,剔除标准,指定变量保留在模型的显著水平,后退法

7、默认为0.10,逐步法是0.15标准化偏回归系数STB可用来比较各个自变量作用的大小实例1假设我们有一个数据,45个观测值,四个变量,包括:age(年龄,数值型);vision(视力状况,二分类:1表示差,0表示好);drive(驾车教育,二分类:1表示参加过驾车教育,0表示没有);Accident(去年是否发生事故,二分类:1表示出过事故,0表示没有)。考察前三个变量与发生事故的关系。程序datalogistic;inputaccidentagevisiondrive;cards;1171114400148101550017511035

8、01……………131011161016110;run;proclogisticdata=logisticdescending;modelaccident=agevisiondrive/sele

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。