资源描述:
《模式识别8-支持向量机(SVM)课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、SupportVectorMachine支持向量机内容SVM的理论基础线性判别函数和判别面最优分类面支持向量机SVM的理论基础传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。传统的统计模式识别方法在进行机器学习时,强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。推广能力是指:将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。SVM的理论基础“过学习问题”:某些情况下,当训练误差过小反而会导致推广能力的下降。例如:对一组训
2、练样本(x,y),x分布在实数范围内,y取值在[0,1]之间。无论这些样本是由什么模型产生的,我们总可以用y=sin(w*x)去拟合,使得训练误差为0.SVM的理论基础根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化置信范围值,因此其推广能力较差。Vapnik与1995年提出的支持向量机(SupportVectorMachine,SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法
3、。SVM的理论基础由于SVM的求解最后转化成二次规划问题的求解,因此SVM的解是全局唯一的最优解SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中.线性判别函数和判别面一个线性判别函数(discriminantfunction)是指由x的各个分量的线性组合而成的函数两类情况:对于两类问题的决策规则为如果g(x)>=0,则判定x属于C1,如果g(x)<0,则判定x属于C2线性判别函数和判别面方程g(x)=0定义了一个判定面,它把归类于C1的点与归类于C2的点分开来。当g(x)是线性函数时,这个平面被称为“超平面”(hyperpl
4、ane)。当x1和x2都在判定面上时,这表明w和超平面上任意向量正交,并称w为超平面的法向量。超平面线性判别函数和判别面判别函数g(x)是特征空间中某点x到超平面的距离的一种代数度量.线性判别函数和判别面广义线性判别函数在一维空间中,没有任何一个线性函数能解决下述划分问题(黑红各代表一类数据),可见线性判别函数有一定的局限性。线性判别函数和判别面广义线性判别函数如果建立一个二次判别函数g(x)=(x-a)(x-b),则可以很好的解决上述分类问题。决策规则仍是:如果g(x)>=0,则判定x属于C1,如果g(x)<0,则判定x属于C2。线性判别函数和判别面线性判别函数和判别面广义线性判别函数
5、最优分类面SVM是从线性可分情况下的最优分类面发展而来的,基本思想可用下图的两维情况说明.图中,方形点和圆形点代表两类样本,H为分类线,H1,H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大.推广到高维空间,最优分类线就变为最优分类面。最优分类面设线性可分的样本集:D维空间中的线性判别函数:这样分类间隔就等于,因此要求分类间隔最大,就要求最大.而要求分类面对所有样本正确分类,就是要求满足最优分类面求最优分类面(最大间隔法)已知:求解:目标:最优分类面
6、这是一个二次凸规划问题,由于目标函数和约束条件都是凸的,根据最优化理论,这一问题存在唯一全局最小解.原问题最优分类面凸集和凸函数凸函数的极小:若问题有局部解,则这个局部解是整体解.最优分类面首先建立Lagrange函数最终可得到对偶问题最优分类面线性不可分的情况下,可以条件中增加一个松弛项 成为已知:求解:目标:最优分类面折衷考虑最少错分样本和最大分类间隔,就得到广义最优分类面,其中,C>0是一个常数,它控制对错分样本惩罚的程度。支持向量机上节所得到的最优分类函数为:该式只包含待分类样本与训练样本中的支持向量的内积运算,可见,要解决一个特征空间中的最优线性分类问题,我们只需要知道
7、这个空间中的内积运算即可。对非线性问题,可以通过非线性变换转化为某个高维空间中的线性问题,在变换空间求最优分类面.这种变换可能比较复杂,因此这种思路在一般情况下不易实现.支持向量机核:支持向量机支持向量机核函数的选择支持向量机SVM方法的特点①非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射;②对特征空间划分的最优超平面是SVM的目标,最大化分类边界的思想是SVM方法的核心;③支持向量是SVM的训练结