资源描述:
《基于多支持向量机的DT算法研究及应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于多支持向量机的!"算法研究及应用王海瑜潘泉张洪才张绍武(西北工业大学自动控制系,西安7%""7!)=>?-0@:ABCD%2#EF/GBHI?-0@$FH?摘要该文提出一种利用多个支持向量机分类器的输出向量来实现对分类器进行融合的决策模板算法,且采用交叉验证的方法得到模板,并将其运用到蛋白质结构类分类当中。实验表明:该文算法可有效提高分类精度,因此具有一定的应用价值。关键词决策模板支持向量机分类器融合交叉验证蛋白质结构类文章编号%""!>&DD%>(!""#)%&>""&D>"!文献标识码J中图分类号9KD"%$3#$%$&’()&*+,--
2、./(&0/1*12!$(/%/1*"$3-.&0$,.41’/0)35&%$+1*67.0/-.$8.&%%/2/$’%9&*4:&/;7<&*=7&*>)&*4:1*4(&/>)&*4?)&1@7(8L.-MI?L/IHNJOIH?-I0FPH/IMH@,QHMIBAL5ILM/KH@CILFB/0F-@R/0SLM50IC,T0U-/7%""7%),A%0’&(0:V/HMWLMIHM-05LIBL.LMNHM?-/FLHN?O@I0.@LF@-550N0LM5NO50H/,-/LAWLF050H/IL?.@-IL-@6HM0IB?X-5L
3、WH/IBLHOI.OISLFIHM5HN5O..HMISLFIHM?-FB0/L-/WIBLFMH55S-@0W-I0H/?LIBHW05.ML5L/ILW0/IB05.-.LM$KMHIL0/5IMOFYIOMLF@-55F@-550N0F-I0H/LZ.LM0?L/IMLSL-@5IB-IIB05-@6HM0IB?F-/LNNLFI0SL@CL/B-/FLIBL-FFOM-FCHNMLFH6/0I0H/,5H0I?-CB-SL-..@0F-I0H/S-@OL$B$;@1’+%:WLF050H/IL?.@-IL,5O..HMISLFIHM?-
4、FB0/L,F@-550N0LM5NO50H/,FMH55S-@0W-I0H/,.MHIL0/5IMOFIOMLF@-55%该文以*+,和决策模板融合算法’(7)89算法)为基础进行引言模式识别研究中,为了更好地处理所遇到的问题,提出了改进,以得到较好的结果,并将算法用于蛋白质结构类分类中,多分类器组合’%(#)的思想,它利用了不同的特征和分类器之间的分类效果验证了算法的可行性。互补,为提高系统的精度和鲁棒性提供了有效途径。具体地说,采用多分类器组合的主要原因有两个方面:!基于多支持向量机的89算法从样本来说:当样本的特征不同(包括:物理意义不同
5、、表!$%多分类器融合模型达形式不同和提取方式不同)时,采用不同的合适的分类器分别进行处理,可以得到较好的结果;当样本有非常多的特征时,采用多个分类器分别在不同的样本特征子集上进行识别,再使用组合器将之组合到一起,不失为一种较好的方法。从分类器来说:不同类型或是类型相同但参数设置不同的分类器,在处理各自特定的问题时,会取得不同程度的成功。如果将这些不同类型或相同类型但参数设置不同的分类器组合起来,吸收它们各自的优点,将多个分类器的信息加以综合,则可以提高整个识别系统的性能。图%多分类器融合模型支持向量机(*+,)是+-./01’2,3)等人根据统
6、计学习理论提出的一种新的机器学习方法,其判别函数为:对于单个分类器,可以有以下决策模型:#(!"!)456/#"!!,"!)’($(%)假设模式识别空间+由互斥的,个类组成,+*,%!⋯!$%$&("$$4%,,,令#4:%,!,⋯,,;,对+中的任意一个样本",分类器给出了一个标号)"#!:,<%;来表示"",())#,’%),或者"被拒识&("!,"!)称为核函数,核函数的选取应使其为特征空间的$)()*,<%)。一个点积,既存在函数",使"("!$)·"("!))*&("!$,"!))。作者所用而在使用多分类器识别时,其决策模型是:的分类器
7、全部采用*+,,由于所用的特征集不一样,支持向量对于一个输入",每个-&,&*%,⋯.产生一个子集/&$#,机的参数和结构也不同。则组合问题是如何使用这些事件-(")*/&,&*%,⋯,.构造一个基金项目:西北工业大学研究生创业基金作者简介:王海瑜(%[7[>),男,硕士,研究方向:模式识别,生物信息。计算机工程与应用!""#$%&&D分类器!,使得:!(")#$,$!!"8%9%:。其中&’可以是一个值支持向量机的+,算法时可以直接利用其输出向量来计算+=(抽象层次),可以是一个有序队列(排序层次),也可以是%个阵和+,阵。故(!)式中:概率值
8、(度量层次)。这三个层次所包含的信息量是递增的,度+,(,$")>?@A(3,,$)(2)%量层次的信息量最大。’?@A(3,,4)!$