欢迎来到天天文库
浏览记录
ID:20859822
大小:232.77 KB
页数:5页
时间:2018-10-17
《基于svm算法的分类器设计论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于SVM算法的分类器设计摇光摘要:本篇论文介绍了SVM分类器的设计原理,基本思想,对于线性可分和线性不可分有具体的实验步骤和设计的原理基础,以及该分类器在现实中应用。对SVM算法的线性和非线性分类进行实验研究,其具体算法代码川Matlab代码來实现。实验结果表明,SVM将平如内具冇线性可分的点,在平谢内找到一个可以划分的分界线,对平而内的点进行划分,这些点分别位于分隔线的两侧。若平面内的点是线性不可分,则SVM会将平而内的点映射到到更萵维度,在离维空间中找到划分所需要的分界线,然后再应用线性可分的情况的方法进行分类。关键词:句S:机;线性吋分;线性不可分;
2、最大间隔引言在现实中,我们会遇到一些分类的问题,比如,将平面上的点分为两类。如果,这个问题,对于在线性可分的情况下,我们可以直接用SVM算法对平而上的点进行划分,然而,并非所有的点都是线性可分的,那么,当我们遇到这样的问题时,我们又该怎么办呢?这就盂要对特征空间进行降维,通过某种映射,我们可以将平台上的点映射到其他的空间,例如,球而或者其他立体区域。这样,我们可以很容易的在某他另外一个空间找到我们所需要得到“分界线”来将这些待分类的点进行划分。这基本上就是SVM分类器的设计原理和基本思想。若待分类的点是线性不可分,SVM通常将将待分类的点映射到某些高维空间,
3、在髙维空问找到能将这些点划分的“超平面”,然后对待分类的点进行划分。1实验方案1.1实验目的以Matlab为实验的开发平台,使用Libsvm工具箱设计出一个SVM分类器,并用公共数据库中现存的数据集为训练样例和测试样例,采用最优的方法的参数训练出分类器,并且用设计出的SVM分类器进行测试。1.2分类标准的起源:logistic回归在对待分类点进行划分时,我们会得到一个二维平面,平而內有不同的点,如图1.1.1所示,这些点有红色的,也有绿色的,还有一条蓝色的线。这条线可以看成是一个“分界线”也就是所谓的“超平面”。如何用这条蓝色的线将红色的点和绿色的点进行划分
4、出来?平而内待分类的点用x表示,所要划分的类别用y表示,•(这里y可以取1或者-1,分別代表两个不同的类别),本次SVM分类器没计的实FI标是在平面内找到一个“分界线”也就是所谓的“超平而”,将平而内的点x进行分类。而这个超平而的方程可以表示为(wT中的T代表转置):wTx+b=0(这个1或-1的分类标准源于logistic冋归)。Logistic冋归得目的是从特征学习fli一个0/1的分类模型,而这个模型则是将特性的线性组合作为自变量,因自变垃的取值范围是从负无穷到正无穷。因此,使用logistic函数(或称作sigmoid函数)将自变量映射到(0,1)上
5、,映射后的值被认为是属于y=l的概銮。假设函数:hex)='其中x是n维特征向量,函数g就是logistic6函数。而沁)1图1.1g(z)函数图像P(s=1Ix )=he(T)P(s=0Iz;0)=1-/ifi(j-)可以看到,将无穷映射到了(0,1)。而假设函数就是特征属于y=l的概率。从而,当判别一个新来的特征属于哪个类时,只需要求心00,若心(x)>0.5则属于y=l的类,反之属于y=0类。另外,只与&•有关,若,0rx〉o,则心(x)〉0.5,而g(z)只是用来映射,真实的类别决定权还是再,当0~》00寸,Mx>i,反之心00=0。如果我们只从出
6、发,希望模型达到的H标就是让训练数据中y=l的特征而是y=0的特征Logistic回归就是要学习得到I使的正例的特征远远大于0,负例的特征远远小于0,并且要在全部训练实例上都达到这个0标。之后,尝试将logistic冋归进行变形。首先,将使用过的结果标签y=0和y=1替换为y=-l,y=1,然后,将eTx=00+6a+e2x2+…+eny,(X。=1)中的e0替换为b,最后将+…+0n^替换为6^82X2+…+0nxrt(即WTX)。这样,则有了+b。就是说除了y由y=0变为y=-l外,线性分类函数跟logistic回归的形式化表示〜⑻=P(5rx)=+b)
7、没有什么区别。进一步,还可以将假设函数⑻=^(’x+b)中的g(zHfe一个简化,将其映射到y=_l和y=l上。得到的映射关系如下:1.3实验步骤1.3.1线性可分对于一个给定的平面,(一个超平面,在二维空间就是一条直线>,平面内有不同的点,如图1.1.1所示,这些点有红色的,也有绿色的,还有一条蓝色的线。这条线nJ以看成是一个“分界线”也就是所谓的“超平而”。如何用这条蓝色的线将红色的点和绿色的点进行划分出来?从图1.2.1可以看出,这条蓝颜色的线把红颜色的点和蓝颜色的点分开了。而这条蓝颜色的线就是我们所说的超平而。在这条蓝线两侧的数据点x所对应的y值一侧
8、全为-1,另一侧全为1。我们可以用分类函数f(x)=
此文档下载收益归作者所有