指标联合的ROC曲线分析.pdf

指标联合的ROC曲线分析.pdf

ID:56752428

大小:128.55 KB

页数:2页

时间:2020-07-07

指标联合的ROC曲线分析.pdf_第1页
指标联合的ROC曲线分析.pdf_第2页
资源描述:

《指标联合的ROC曲线分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、中国卫生统计2003年10月第20卷第5期·279·指标联合的ROC曲线分析1223邹莉玲沈其君陈启光王文梅临床上对于同一种疾病的诊断或筛检,往往有各数,也即是Fisher判别函数的系数。要使得指标线性种不同的诊断方法或手段,涉及的诊断指标是非常多组合后的ROC曲线下面积达最大,则a满足下式:-1μ的。不同的指标对疾病各方面敏感性是不一样的,因a∝(∑x+∑y)这里μ=μy-μx(2)此在对疾病做出诊断时如何充分利用这些指标的诊断基于系数向量a,可得到指标线性组合后的灵敏信息,就显得非常重要。度和特异度,以及ROC曲线方程。以Fa(·)表示U评价某个诊断试验或诊断指标时常用到的

2、是灵敏的累积分布函数,Ga(·)为V的累积分布函数,Fa(c)度和特异度,综合指标有ROC曲线下的面积。对于两表示特异度,Ha(c)=1-Ga(c)为相应的灵敏度。显种或多种诊断试验的评价和比较,已有的方法主要包然任意一个给定的特异度p0,必定有一常数c与之相括比较各自ROC曲线下的面积,在特异度固定条件下对应,这里c同样可以理解为诊断界值或切入点(cut2比较灵敏度的大小,以及James于1989年提出的以灵off2point)。敏度的加权平均为基础的多指标比较的统计量〔1〕。Tc-aμx而将多个指标结合起来综合分析的方法仍以传统的多特异度:Fa(c)=ΦT=p0(3)a∑x

3、a元统计分析方法为主,包括多元线性回归、参数和非参对上式求反函数得到:数判别分析以及指标的聚类分析等。多指标结合的T-1TROC曲线分析方法目前仍处在探索阶段,已见诸报道c=aμx+Φ(p0)a∑xa(4)的有以logistic回归模型为基础的ROC曲线分析,可对应的灵敏度为:用于协变量存在条件下的诊断数据的分析〔2〕。本文Ha(c)=1-基于Fisher的判别准则,给出多变量线性组合的ROCaT(μμ)+Φ-1(p)aTax-y0∑x曲线分析方法。Φ()Ta∑ya多变量线性组合的ROC曲线及面积计算(5)假定病例组和对照组的人数分别为n和m,各测式(3)和(5)便构成了多指标

4、线性组合后所得ROC曲得p个指标值。以Xik(k=1,⋯,p)表示对照组中第线上的点。i个个体的第k个指标值,Yjl(l=1,⋯,p)表示病例结合前面的式(2),由式(5)通过积分可以得到〔3〕组中第j个个体的第l个指标值,这里X=(X1,⋯,ROC曲线下的面积:XTTT-1p),Y=(Y1,⋯,Yp)。X和Y均为服从正态分A=Φ(μ(∑+)μ)(6)x∑y布的二元随机变量,即X~N(μx,∑x)和Y~N(μy,同样这里的μ=μy-μx。∑y)。由于多维数据的处理通常是非常困难的,因此均数向量和协方差阵的估计我们通过有效地构建多个指标间的线性组合来实现降维。总体分布的均数和协方

5、差阵通常无法知道,只能TTμxTU=aX~N(a,a∑xa),由样本来估计。V=aTY~N(aTμy,aT∑a)(1)依照前面的假设,有来自(某病)阴性总体的独立y)T同分布样本X1,⋯,Xm~N(μx,∑x),来自(某病)a=(a1,⋯,ap表示多个指标的线性组合系11同济大学基础医学院预防医学教研究(200092)21东南大学公共卫生学院卫生统计教研室(210009)31南京市口腔医院内科(210008)·280·ChineseJournalofHealthStatistics,Oct2003,Vol.20,No.5阳性总体的独立同分布样本Y1,⋯,Yn~N(μy,对三个指

6、标分别计算各自的ROC曲线下面积,其∑y)。μx和μy均为p维向量,可用样本的均数来估结果为:01743(DI),01924(PCNA),01965(AgNOR)。∧由此提示将三个指标综合起来考虑对于口腔颊囊粘膜计;∑x和∑y为p×p矩阵,它们的ML估计值Σx癌变的诊断和监测可能具有更大的实际意义和应用价∧和Σy分别为:值。∧TΣx=Sx/(m-1)=[∑(Xi-XŠ)(Xi-讨论XŠ)]/(m-1)(7)〔4〕外国学者Bamber于1975年提出ROC曲线下∧TΣy=Sy/(n-1)=[∑(Yj-•Y)(Yj-的面积(AUC)等于病例组中指标测量值高于正常人•Y)]/(n-1

7、)(8)群测量值的百分数这一基本概念之后,相继有学者对将以上μ和∑x、∑y的估计值代入公式(6),就可以算ROC曲线下面积的计算方法作了种种研究和探讨,针得ROC曲线下面积的估计值^A。全部的计算过程用对资料是否连续,有无重复测量,以及有无缺失数据等SAS即可实现。问题,提出了各种参数和非参数的计算方法。但主要都是用于单个诊断试验或指标的,对同一诊断或筛检实例分析试验多个指标的ROC分析方法的报道却很少,只是越来越多的临床资料表明肿瘤发生与细胞增殖及90年代以后才有一些国外学者开始对多指标的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。