资源描述:
《诊断试验ROC评价的样本含量估计方法_谷红梅.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、JournalofMathematicalMedicineVol.18NO.42005文章编号:1004-4337(2005)04-0372-04中图分类号:R311文献标识码:A·综述·诊断试验ROC评价的样本含量估计方法*谷红梅李康(哈尔滨医科大学卫生统计学教研室哈尔滨150001)摘要:ROC已成为公认的诊断试验准确性评价指标。针对单一试验和两诊断试验比较的ROC评价研究设计,其所需样本含量估计方法目前分别有三种常用方法,即双正态法、非参法和稳健法。涉及多个观测者时,其所需样本含量估计目前常用方法是稳健法。关键词:诊断
2、试验;ROC评价;样本含量估计ROC(ReceiverOperationCharacteristic)曲线下面积概括通常是将待评价试验的准确性与事先规定的无效值H0比较,了诊断试验的综合诊断能力,而成为公认的诊断试验准确性即:H0:$=H-H0=0,此时患病组样本量NA为:评价指标[1]。1995年美国临床试验室标准化委员会(NCCLS)(N5/2+ZB)2V(Hd)NA=2(2)$将ROC曲线引入其标准和指南文件,颁布了《使用ROC曲线上式中A为Ⅰ类错误概率,B为Ⅱ类错误概率,Z为标准[2]评价临床试验的准确度》(GP10
3、-A)批准指南。诊断试验评ddd正态分布的分位数,V(H)=NAvar(H),var(H)是无效假设时H价可以是一种新的诊断方法与“金标准”比较,也可以是一种的方差估计值。$值为H的1-A可信区间长度,即H的1-A改进的诊断方法与常规诊断方法进行比较。受检者可能接受d可信区间上限值与下限值之差,V(H)用式(3)计算:的是生化指标检查诊断,也可能接受的是影像检查诊断,不同d22222V(H)=[f][1+B/R+A/2]+[g][B(1+R)/(2R)]的诊断试验评价设计不同,所需要的样本量也不同。故样本含+2[f][g][
4、AB](3)量估计是其研究设计的一个重要部分。如果片面追求增大样式中A、B分别为参数B0、B1的估计值;R为非患病组与本例数,以“大量观察”作为确定样本含量的重要原则,其结果患病组样本量的比例。中间量f、g的计算方法如下:会导致人力、物力和时间上的浪费,也有可能引入更多的混杂exp(-A2/2[1+B2])f=(4)因素,对研究结果造成不良影响;相反,如果样本含量偏少,检{2P(1+B2)}验效能偏低,可能导致诊断试验本来存在的阳性结果未能显-(AB)exp(-A2/(2[1+B2]))g=(5)示出来,出现假阴性结果,最终
5、影响诊断试验评价结果的真实{2P(1+B2))3}性。本研究将近年ROC评价诊断试验的样本量估计研究进展实际计算时使用式(6)取代公式(3):dd22222作一简单介绍。V(H)=[f][1+B/R+A/2]+[g][B(1+R)/(2R)](6)1单个诊断试验评价的样本含量估计其目的使公式(3)中所隐含的A、B的协方差Cov(A,B)=单个诊断试验评价是指一种新的诊断方法与“金标准”进AB/(2NA)为零,得到H较大的方差,保证估计结果更稳健。实际行比较,它所需的样本量可因测量方式和试验数据类型等不应用时,通常假定非患病组
6、与患病组的方差相同(B=1),A可以同而不同,样本量估计的常用方法有以下几种。通过预期的曲线下面积Hd计算出来,即A=(1+B2)×5-1d1.1双正态法(H),也可以通过待评价试验预期的灵敏度TPR和特异度(1--1(1-FPR)-5-1(1-TPR)。假设实际诊断试验评价中,X、Y分别表示非患者和患者FPR)计算A,即A=B5诊断试验测量结果,且X∈N(LN,RN),Y∈N(LA,RA),经单调由上可见,单一诊断试验准确性ROC评价,用双正态法转换服从正态分布,则可用两个参数确定ROC曲线,即B0=估计其所需样本量,与下
7、述条件有关:¹Ⅰ类错误概率,Ⅱ类(LA-LN)/RA,B1=RN/RA。令LA≥LN,ROC曲线下面积H为[3]:错误概率;º非患病组与患病组标准差之比;»预期曲线下面dcø2积H,或待评试验预期灵敏度TPR和特异度(1-FPR);¼非H=5[B0+B1M]U(M)dv(1)dcø1患病组与患病组比例R;½预期曲线下面积H的1-A可信区其中5是正态分布概率累计函数,cø-1i=5(FPRi),当间长度。cø[1]1=-∞,cø2=+∞时,H为曲线下总面积。对诊断试验评价,1.2非参数法收稿日期:2004-10-28*现在牡丹
8、江医学院预防医学教研室工作·372·数理医药学杂志2005年第18卷第4期用非参数法对ROC估计时,ROC曲线下面积估计值的2ZA/22V1+ZBV1+V2ddn=(11)标准误SE(H)与H和样本量间存在如下关系:Dddd2d2式中,A为Ⅰ类错误概率,B为Ⅱ类错误概率,ZA/2为相应dH