欢迎来到天天文库
浏览记录
ID:21040390
大小:51.50 KB
页数:4页
时间:2018-10-19
《浅析svm 算法及其在实验中的讨论 》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浅析SVM算法及其在实验中的讨论罗丹新疆农业职业技术学院新疆昌吉831100【文章】随着SVM分类算法的不断完善和优化,其在人工智能及机器学习领域得到了广泛应用,并且也深入到了实际应用中。支持向量机早期仅用于监督学习,这些年随着半监督学习的迅速发展,支持向量机在半监督学习中也起到了很重要的作用。在如何划分低维空间向量集是一个普遍存在的难题,为了解决这个问题,我们需要找到一个合适的核函数,这样就可以能够有一个较好的存在于高维空间的分类函数。在支持向量机的理论中,每一个核函数都会产生一个不一样的算法,而这种算法的基础则是统计学理论。【关键词】人工智能;SVM算法;分类器随着人工智能及
2、机器学习的飞速发展,数据在X络传播中的应用日益增多,SVM分类算法在人工智能及机器学习领域得到了广泛的应用。支持向量机早期仅用于监督学习,这些年随着半监督学习的迅速发展,支持向量机在半监督学习中也起到了很重要的作用,并受到了广泛的亲睐。SVM算法不仅在理论上有了很好的应用,在实际应用领域也得到了极大的推广和应用。核函数是支持向量机的很函数,这也是其受到亲睐的主要原因。在如何划分低维空间向量集是一个普遍存在的难题,通常为了解决这个问题,我们会把低维空间的向量集映射到高维度的空间中,但是在这个过程中会大大增加机器计算的时间复杂度,而解决这个瓶颈问题的方法就是选择合适的核函数,换言之,
3、当我们找到一个合适的核函数,我们就能够有一个较好的存在于高维空间的分类函数。在支持向量机的理论中,每一个核函数都会产生一个不一样的算法,而这种算法的基础则是统计学理论。支持向量机是基于线性划分的。但是可以想象,并非所有数据都可以线性划分。通常情况下,我们需要用一个曲线来划分存在于二维空间中的两个类别的点,以此来作为它的边界,而我们把低维度的点映射至高维空间,让其能够实现线性可分,映射后的我们通过线性划分作为依据来推断这个分类的边缘。在我们之前的数据空间中,它们都被视为非线性可划分的,在映射后的高维度空间中,我们视其为线性可划分的。但是在学习探索的郭晨各种我们主要需要思考的为题是其
4、如何找到最优解,也就是我们所说的最优化问题,而非怎么去定义一个算法来实现性低维度到高维度的的映射问题。在讨论SVM分类的问题上,我也还要考虑其时间复杂度,通常我们所说的训练过程中的复杂度是指二次规划,在考虑其复杂度的时候通常我们要考虑两个问题,一个是解析解,一个是数值解,解析解相对来说比较的准确,它也属于我们理论上所能得到的解,我们用表达式来表达,换句话说,当一个问题只要是有解的,那么我们就可以说它一定是存在解析解的。但是这里我们需要强调虽然我们所解析解一定存在,但是能在有限或者相对有限的时间内解出这个解,或者一定能够解出解,这就是另一个问题了。我们在讨论SVM的问题上考虑到时间
5、复杂度最不理想情况是O(NSV3),我们将支持向量的数量用NSV表示,目前并没有一个特定的比例来规定训练集和支持向量的数量,但是我们一般情况下视支持向量的数量与训练集样本的大小是有关联的。因此我们可以了解在一对一的方法中,虽然训练两类分类器的数量很多,可是我们考虑总的花费时间要比一个和剩下的方法相对要上,这是因为其他的方法都把全部的训练样本都考虑进去,这样花费的时间就比较多,速度就会下降。SVM通过特征变换,将原来空间中的线性问题转化成为在新的空间中的线性的问题。在求解的过程中,所用到的分类器:f(x)=sgn(0cm0pt"class=Pa4>我们将x特征进行一个非线性的变换将
6、其记z=Φ(x),那么就会产生一个新的支持向量机的决策函数在新的特征空间里:f(x)=sgn(0cm0pt"class=Pa0>实验研究ExperimentalResearch电子制作(xi)·Φ(x))+b);在新的空间域旧的空间的转变的过程中,所用到的K就是我们所说的核函数:K(xi,x)=(Φ(xi),Φ(x));作为新的SVM判别函数,用于新的空间中:f(x)=sgn(0cm0pt"class=Pa4>其中,系数ɑ是下列优化问题的解:MaxQ(ɑ)=Σɑi-1/2·ΣɑiɑjyiyjK(xi,xj);S.t.Σyiɑi=0;最后我们就可以得到一个原来空间的用来分类的判别函
7、数。常用的核函数有:1)多项式核函数:K(x,x’)=((x,x’)+1)q;2)径向基核函数:K(x,x’)=exp(-
8、
9、x-x’
10、
11、2/σ2)3)Sigmoid函数:K(x,x’)=tanh(v(x·x’)+c);通过实验我们可以得到结果:使用model=svmtrain(label,data)函数,有两类样本。data是一个4x2矩阵,表示有4个样本,每个样本有2个属性。则label为4x1,可以用1,-1来表示每个样本是属于哪一类。(label为分类,data为矩阵。)
此文档下载收益归作者所有