资源描述:
《自动目标识别算法的识别率比较方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1034第18卷第9期2008年9月3自动目标识别算法的识别率比较方法33何峻付强国防科技大学ATR重点实验室,长沙410073摘要针对模式识别领域中所关注的自动目标识别(automatictargetrecognition,ATR)算法识别率比较这一共性问题,首先归纳分析了现有的识别率比较方法并分别指出其局限性.提出了一种新的基于Bayes分析的识别率比较方法———后验概率比较法.然后运用该方法分析了ATR算法识别率比较过程中所特别关注的选优和排序这两个典型问题,证明了应用最大似然原理的合理性.最后定量分析了比较结果的可信程度与所需的测试样本容量之间的约束关系,所得到的图
2、表能够有效指导ATR算法评估试验的设计和测试数据采集工作.关键词模式识别算法评价不确定分析近年来,自动目标识别(automatictargetrec21识别率比较方法回顾ognition,ATR)技术在SAR图像检测、医学CT诊断、生物特征识别、手写/语音鉴别等多个模式识总的来说,现有的识别率比较方法基本上都是别的应用领域中取得了长足进步.ATR算法是实采用频率派的经典统计理论来设计假设检验或统计现ATR技术的主要研究内容之一,对ATR算法进推断问题来实现比较.本节主要对这些方法进行归行性能评估也一直是模式识别问题的关注热点.衡纳总结和分析.量ATR算法性能优劣的一个基本评
3、价指标就是算111点估计值比较法法对待识别对象的正确识别概率,简称“识别率”最直接的一种方法是先对各ATR算法的识别[1](某些领域习惯上采用等价的“误识率”).率p(或等效的误识率e)进行点估计,然后用所得本文所关注的问题可归结为:给定测试集,到的估计值^p进行比较.以识别率为指标比较不同ATR算法的性能优劣.ATR算法的单次识别结果可用一个二值变量x这里将ATR算法识别率的估计和比较作为两个来表示:x=1,表示ATR算法正确识别;x=0,不同问题区分对待.诚然,估计问题的目的之一表示错误识别.测试样本容量为n时,可用序列xi就是为了比较不同ATR算法的识别率,而且在(x
4、i=1or0,i=1,2,⋯,n)记录整个识别过程.样本容量趋于无限大时估计的结果就能够实现识若用X表示总的正确识别次数,即别率的比较,二者没有太大的区别.但现实中受n限于测试样本容量,对ATR算法识别率的估计X=∑xi(1)和比较还是各有侧重:识别率估计主要关心估计i=1[2]精度;而比较则是以识别率高低为依据进行推则X是一个服从二项分布的随机变量X~B(n,断.p).识别率的估计值^p的计算式为2008202220收稿,2008203219收修改稿3武器装备预研重点基金(6140522);装备预先研究项目(51301050102)资助33E2mail:hisjune@1
5、631com第18卷第9期2008年9月1035n1X^p1(1-^p1)^p2(1-^p2)^p=∑xi=(2)(^p1-^p2)+zα/2+ni=1nn1n2(3)点估计值比较法的确是一种识别率的比较方法,而且也在被广泛地自觉或不自觉地运用着.但(3)式中n1和n2分别表示对ATR算法1和算法2仅使用点估计值难以直接定量计算所得到比较结果进行测试的样本个数.若采用同一批样本进行测的可信程度,也不能分析和计算为达到某个置信度试,可令n=n1=n2.所需的测试样本容量n.区间差值法本质上是一种统计推断方法,其统计意义明显,操作简单,在雷达ATR技术的评估112区间估计值比较
6、法[3,4]中也得到了广泛应用.其他的一些识别率比较点估计值不能给出估计结果的置信度和变动范[1]方法,实质上是区间差值法的变形或简化.区间围,而区间估计显然给出了有关p的更多有用信差值法的主要缺陷在于一次只能比较两个ATR算息.因此,利用互不重叠的识别率区间估计值进行法.如果要进行多个ATR算法的识别率比较,需比较也就一度成为SARATR评估中的常规方要进行多次两两比较,然后将这些两两比较的结果[3,4]法.合成总的比较结果.而多个假设检验结果的合成将区间估计值比较法所面临的问题主要有:(i)在导致总的比较结果的置信度降低.样本容量一定的情况下对识别率进行区间估计,置信度
7、和区间长度相互制约.(ii)识别率的置信区间114R&S法[11]不是区间数(关于区间数的定义可参考文献[5]或文R&S法是Gibbons针对总体排序选优而提献[6]的引述),其“正确性”仅在一定置信度下成出的一种方法.R&S法并不是要确定m个总体的立.这意味着:以区间估计值进行ATR算法比较,成败率pi,而是要从m个具有二项分布的总体中选实质上是一种以具有不确定性的“命题”为基础的择具有最大p值的那个总体.在确定了比较结果的推理过程.而按照不确定推理的一般原则,多个命显著性水平α之后,决定所需最小测试样本容量题的