欢迎来到天天文库
浏览记录
ID:21268622
大小:487.50 KB
页数:24页
时间:2018-10-20
《基于最大间隔法的分类模型-韶关学院统一认证平台》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于最大间隔法的分类模型朱森华黄足花何琳珊何显灿(韶关学院数学与信息科学学院,指导教师:简国明、杨光武)摘要:本文首先通过对已知蠓虫的数据进行分析,建立基于最大间隔法的分类预测模型,对非线性规划问题的求解,在允许一定的误差范围之内,通过设计新的算法,通过简单的循环搜索代替非线性规划问题的求解,在二维平面的求解中具有一定的优势;通过收集的数据对模型进行求解可得最有的划分超平面房程为:;对于三个新的未确定类别的蠓虫的数据,利用所所建立的模型,建立判别函数可得(1.24,1.80)、(1.28,1.84)属于Af,(1.40,2.04)属于Apf;为了使得能够对事物进行更加精确的预测
2、和判断,需要增加辨别不同事物的特征,这样就需要把模型推广的三维或更高维的空间,使得模型具有更广泛的应用.关键词:最大间隔;超平面;法向量1问题的提出生物学家Grogan和Wirth曾试图就两种蠓虫Af和Apf的鉴别问题进行研究,Af是宝贵的传粉益虫,Apf则是某种疾病的载体毒蠓,希望建立一种正确区分两种蠓虫的模型.在现实生活中,有些事物要想从本质上区别开来可能会比较困难或者要付出比较大的代价,基于最优化的数学思想,为了付出最小的代价来区别不同的事物,可以从事物的一些特征来区别.朱森华论文第24页共24页建立一个模型,能够利用事物的某些特征来对不同类的事物加以区分具有非常重要的意
3、义.例如,考虑病人患病的确诊问题.在为完全确诊某些疾病的检查中,有些检查可能是十分昂贵的,或者是创伤性的.因此,利用一些有关的容易获得的临床指标进行辅助性的推断是一项有意义的工作.到目前为止,分类的模型和方法有很多,例如神经网络分析方法、支持向量机方法、模糊模式识别方法等.不同的算法有不同的优缺点.本文借助最大间隔法的思想,重新设计算法,避免对非线性规划问题的求解,减少了计算量;利用已知数据,建立分类模型,对蠓虫进行分类.2模型假设及符号说明2.1模型假设(1)假设已知的数据是准确可靠的.(2)模型只针对普通的一般的蠓虫进行分类.2.2符号说明:直线的法向量:直线的斜率:两平行
4、直线之间的距离:分类判断函数:向量与的夹角朱森华论文第24页共24页:Lagrange函数:对Lagrange函数中的其中一个变量求偏导数3二维平面的最大间隔法分类模型3.1模型的分析及数据准备根据所收集的数据:表1Af数据触角长1.241.361.381.381.381.401.481.541.56翼长1.721.741.641.821.901.701.821.822.08表2Apf数据触角长1.141.181.201.261.281.30翼长1.781.961.862.002.001.96通过MATLAB得到以下分布图:朱森华论文第24页共24页图1Af和Apf分布图由Af
5、和Apf的分布图可以看到存在一条直线,可以把两类蠓虫完全分成不相交的两部分,即两类蠓虫是线性可分的.我们已经知道了存在一条直线可以完全的把两类蠓分成不相交的两部分,接下来要做的就是怎样把这条直线找出来,这条直线又是否是唯一的?如果不唯一有应该选取那一条直线才是最合理的?可以把两类蠓完全分成不相交的两部分的直线是不唯一的,这是很显然的,我们只要把原来的直线通过微小的平移,就可以得到第二条划分的直线;转动一个微小的角度,显然得到的直线仍然可以完全把两类不同的数据点集分成不相交的两部分.朱森华论文第24页共24页图2Af和Apf的线性划分图不但可以通过平移直线来得到不同的划分直线,而
6、且还可以通过改变直线的斜率来得到不同的划分直线.这样就存在无数条满足条件的划分直线.应该怎样选取才是合理的呢?3.2最大间隔分类模型首先选取一个法向量和常数,可以得到直线的方程为,整理可得直线方程为.即直线方程可以表示为,其中,表示两个向量的内积,(此时把这样子得到的直线叫做超平面).通过改变常数项的值来对直线进行上下平移直到碰到某个朱森华论文第24页共24页已知数据为止,这样就可以得到两条直线,此时在两条直线之间的任意一条平行线都可以正确的把已知点集分成不相交的两部分.显然这些直线都可以作为划分直线,在这些候选直线中,恰好位于和中间的那条直线为最好.假设位于和中间的那条直线方
7、程恰好为,则的方程为;的方程为.则法向量对应的距离.最大间隔法就是通过寻找不同的法向量来寻找最大的距离从而确定划分直线的方程.对应距离的值与法向量的选取有关,又法向量只是代表一个方向,其长度是可以任意的,只是和的比值是一定的,所以其对应的最优化问题为:St.为对应的的数据为对应的的数据或转化为:St.为对应的的数据朱森华论文第24页共24页为对应的的数据引入Lagrange函数:其中为Lagrange乘子。通过对原问题中各个变量的偏导取零可得带入Lagrange函数化为原问题的Lagrang
此文档下载收益归作者所有