医学研究中logistic回归与其他方法的结合应用

医学研究中logistic回归与其他方法的结合应用

ID:10631086

大小:55.00 KB

页数:4页

时间:2018-07-07

医学研究中logistic回归与其他方法的结合应用_第1页
医学研究中logistic回归与其他方法的结合应用_第2页
医学研究中logistic回归与其他方法的结合应用_第3页
医学研究中logistic回归与其他方法的结合应用_第4页
资源描述:

《医学研究中logistic回归与其他方法的结合应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、医学研究中Logistic回归与其他方法的结合应用  同时与其他传统的统计学方法一样,Logistic回归也有许多的应用条件:当自变量为连续型变量时,Logitp与自变量成线性,对多元共线性敏感,以及参数估计条件等[1~7],使Logistic回归在单独面对医学领域日益庞大和复杂多变的数据信息时,往往受到一定的限制,无法使数据信息得到充分利用,应用不当还会得出错误结论。因此随着统计学方法的不断发展和新的统计学方法的出现,Logistic回归在越来越多的医学研究的文献资料中常常不再独自出现,而是与其

2、他方法相互结合取长补短,充分利用资料中的信息,从而得出相对正确的结论。本研究将对近几年Logistic回归在医学研究中与其他方法相互结合及比较应用作简要介绍。  1主成分Logistic回归分析  Logistic回归模型与多元线性回归一样,对自变量中存在的多元共线性很敏感。自变量之间的任何相关都表示存在多元共线性。在多元共线性程度较高时,可能导致模型参数的不精确估计,使变量的单独影响不易分解出来,从而把一些本应对应变量有显著影响的变量排除在模型之外。解决共线性的方法一般有:删除冗余的自变量,但在

3、实际中往往会因为无法区别有意义的变量与冗余变量而误删,从而造成模型误设;增加样本含量,使标准误减少,抵消多重共线性的影响。但这种方法只有在多重共线性是由测量误差引起或偶然存在于原始样本而不存在于总体时才适用;用逐步Logistic回归,寻求建立一种最佳回归方程,这种方法容易损失一些信息;用主成分Logistic回归,通过主成分变换,将高度相关的几个变量的信息综合起来参与回归[8],主成分分析能够用少数变量对相关变量进行综合,既能降低指标的维数,又能充分反映指标的信息,从而将变量间共线性问题减弱,对

4、结果不产生影响,这是目前我们最常用的解决共线性的方法。但总的来说,主成分Logistic回归也没有从根本上克服Logistic回归的共线性问题,仍然需要我们寻找更为有效的方法[9,10]。  2Logistic回归在ROC分析中的应用  ROC是受试者工作特征(ReceiverOperatingCharacteristic)或相对工作特征(RelativeOperatingCharacteristic)的缩写,目前已广泛应用于临床诊断性能的评价,ROC曲线是以试验结果的每一个值作为可能的诊断界值,

5、由此计算得到相应的灵敏度和特异度,以假阳性率即特异度为横坐标,以真阳性率即灵敏度为纵坐标绘制而成的曲线即为ROC曲线,其曲线下面积的大小可作为诊断试验准确度的衡量指标,其取值范围为0.5~1。ROC曲线下面积估计可分为参数和非参数两种方法,在实际应用中可根据样本量大小来选择使用[11]。ROC曲线下面积指标因其不受患病率和诊断界值的影响,以及可对两个诊断试验的准确度进行综合比较,因而成为目前公认的最佳评价指标[12]。ROC分析中结合Logistic回归模型简单有效,尤其适用于有协变量或多指标联合

6、诊断试验的分析评价。在一项诊断试验中,由于变异的存在,必然有很多混杂因素(或协变量)对试验的评价产生影响,它们可能对疾病的状态产生影响,也可能对测量结果产生影响。其中可以识别的因素,一般在试验设计阶段应加以控制。但在实际工作中,由于病例问题,在设计阶段进行控制非常困难,因此在统计分析阶段,尽可能地识别、控制混杂因素(或协变量)显得尤为重要。Logistic回归模型能够纳入诊断指标之外的影响因素,有效控制混杂因素,使ROC分析更接近于总体实际情况[13]。  3Logistic回归与数据挖掘技术的结

7、合应用  数据挖掘(DataMining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程[14]。数据挖掘技术是近几年兴起来的一个新的研究领域,其与传统数据分析的本质区别在于:数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。目前与Logistic回归的结合使用多见于以下形式:  分类树模型:分类树模型属于决策树(decisiontree)[15]的一种形式。在应用回归模型分析因变量与自变量之间的回归关系时,常常需要考虑各

8、自变量之间对因变量可能存在的交互作用。当模型中的自变量数量较多,需要考虑的交互作用就会比较复杂,操作起来有一定的困难。而分类树模型作为一种人工智能分析方法,能够快速寻找并发现对因变量的主要影响因素,并在展示自变量间交互作用上有着独到的优势,但它无法分析自变量的线性叠加效应,并且往往把一些自变量之间的线性叠加效应的关系错误地用分层关系进行表达,而回归模型不仅可以较方便地表达自变量之间的线性叠加效应,而且在已知树模型结果的情况下,可以对应构造相应的回归模型表达分层的情况和实现分层统计分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。